MXBai Embed Large V1
mxbai-embed-large-v1 ist ein Einbettungsmodell des deutschen Unternehmens Mixedbread AI. Es wandelt Texte in Vektoren mit 1024 Dimensionen um und basiert auf der bewährten BERT-large-Architektur. Das Modell ist mit rund 334 Millionen Parametern vergleichsweise kompakt und braucht nur etwa 2 GB Grafikspeicher.
In der Praxis überzeugt mxbai durch seine Geschwindigkeit: Es verarbeitet rund 20 Textabschnitte pro Sekunde und ist damit eines der schnellsten Modelle seiner Klasse. Auf dem MTEB-Benchmark, einer standardisierten Bestenliste für Einbettungsmodelle, erreicht es einen Durchschnitt von 64,68 Punkten.
Die Schwachstelle liegt im kurzen Textfenster von nur 512 Tokens. Bei längeren deutschen Texten wird ein erheblicher Teil des Inhalts einfach abgeschnitten. Außerdem wurde das Modell hauptsächlich mit englischen Texten trainiert, was bei deutschsprachigen Inhalten zu Qualitätseinbußen führen kann.