Qwen3-Embedding-0.6B
Qwen3-Embedding-0.6B ist ein Einbettungsmodell von Alibaba Cloud. Es basiert als einziges Modell in meinem Benchmark auf einer Decoder-Architektur (wie ein Sprachmodell) statt auf dem klassischen Encoder-Ansatz.
Mit 600 Millionen Parametern und einem enormen Textfenster von 32.768 Tokens ist es das Modell mit dem größten Kontextfenster im Vergleich. Es kann also selbst sehr lange Dokumente vollständig verarbeiten, ohne Text abzuschneiden.
In den Qualitätstests erreicht Qwen3 100% Hard Negative Precision und eine gute Unterscheidungsfähigkeit. Die Geschwindigkeit ist allerdings die zweitniedrigste (8,7 Chunks/s), was an der Decoder-Architektur und der kleinen Batch Size liegt.