Jina Embeddings V3
jina-embeddings-v3 ist ein mehrsprachiges Einbettungsmodell des Berliner KI-Unternehmens Jina AI. Es basiert auf einer modifizierten XLM-RoBERTa-Architektur mit rund 570 Millionen Parametern und unterstützt ein Textfenster von 8.192 Tokens.
Die Besonderheit von jina-v3: Es kann verschiedene Aufgabentypen unterscheiden. Man teilt dem Modell mit, ob man einen Text zum Speichern (retrieval.passage) oder eine Suchanfrage (retrieval.query) verarbeiten will. Dadurch optimiert es die Vektoren für den jeweiligen Zweck.
In meinem Benchmark ist jina-v3 das schnellste Modell (35,8 Chunks/s), erreicht 100% Hard Negative Precision und hat die beste Unterscheidungsfähigkeit (niedrigste paarweise Cosine-Similarity). Es ist der stärkste Allrounder.