Collaborative Filtering

Ein Musikdienst schlägt einen Song vor, den ein Nutzer nie gesucht hat. Der Song passt trotzdem. Das System hat keine Audiodaten analysiert. Es hat beobachtet, dass andere Hörer mit ähnlichem Verhalten diesen Song häufig abspielen. Dieses Prinzip heißt Collaborative Filtering.

Empfehlungen aus dem Verhalten anderer ableiten

Collaborative Filtering nutzt eine einfache Beobachtung: Menschen, die in der Vergangenheit ähnliche Entscheidungen getroffen haben, treffen mit hoher Wahrscheinlichkeit auch in Zukunft ähnliche Entscheidungen. Statt die Eigenschaften eines Produkts zu beschreiben, wertet das Verfahren aus, wer was getan hat.

Beispiel: Nutzerin A kauft die Bücher X, Y und Z. Nutzer B kauft die Bücher X und Y. Das System schließt: B könnte Z ebenfalls interessant finden, weil A und B ein ähnliches Kaufmuster zeigen.

Der Algorithmus benötigt keinerlei Information über den Inhalt der Bücher. Weder Genre noch Autor noch Klappentext fließen ein. Die gesamte Empfehlung entsteht aus Interaktionsdaten: Käufe, Bewertungen, Klicks, Verweildauer, Abspielhäufigkeit.

Beispiel: Ein Streaming-Dienst registriert, dass Nutzer, die Dokumentationen über Ozeanbiologie ansehen, überdurchschnittlich oft auch Naturfotografie-Serien abrufen. Die inhaltliche Verbindung (Natur) ergibt sich rein aus dem Nutzungsverhalten.

Fachliche Einordnung: Collaborative Filtering gehört zur Klasse der Machine-Learning-Verfahren, die ohne explizite Merkmalsdefinition arbeiten. In der Terminologie des maschinellen Lernens handelt es sich um ein unbeaufsichtigtes oder semi-beaufsichtigtes Verfahren, da keine gelabelten Trainingsdaten im klassischen Sinn vorliegen.

Nutzerbasiert und objektbasiert: zwei Perspektiven

Collaborative Filtering lässt sich aus zwei Richtungen betrachten. Die nutzerbasierte Variante sucht ähnliche Nutzer. Die objektbasierte Variante sucht ähnliche Objekte (Items). Beide Perspektiven führen zu Empfehlungen, aber auf unterschiedlichen Wegen.

Nutzerbasiertes Collaborative Filtering

Das System vergleicht das Bewertungsprofil eines Nutzers mit den Profilen aller anderen Nutzer. Nutzer mit hoher Ähnlichkeit bilden die Nachbarschaft. Aus deren Bewertungen leitet das System Empfehlungen ab.

Beispiel: In einem Online-Shop haben Nutzer A und Nutzer C jeweils 50 identische Produkte mit 4 oder 5 Sternen bewertet. Nutzer C hat zusätzlich Produkt Q gekauft. Das System empfiehlt Produkt Q an Nutzer A, weil die Bewertungsprofile stark korrelieren.

Die Ähnlichkeit zwischen zwei Nutzern wird über mathematische Distanzmaße berechnet. Gängig ist die Kosinus-Ähnlichkeit, die den Winkel zwischen zwei Bewertungsvektoren misst. Kleine Winkel bedeuten hohe Ähnlichkeit.

Objektbasiertes Collaborative Filtering

Hier steht nicht der Nutzer, sondern das Objekt im Zentrum. Das System analysiert, welche Objekte häufig zusammen konsumiert werden. Wenn Objekt A und Objekt B von vielen Nutzern gemeinsam positiv bewertet werden, gelten sie als ähnlich.

Beispiel: Ein Buchportal stellt fest, dass Leser, die "Thinking, Fast and Slow" gut bewerten, überdurchschnittlich oft auch "Nudge" positiv bewerten. Wer eines der beiden Bücher kauft, erhält das andere als Empfehlung.

In der Praxis skaliert die objektbasierte Variante besser. Die Anzahl der Objekte ist in vielen Systemen stabiler als die Anzahl der Nutzer. Die Ähnlichkeitsmatrix zwischen Objekten muss seltener neu berechnet werden als zwischen Nutzern.

Die Bewertungsmatrix und das Sparse-Data-Problem

Collaborative Filtering arbeitet intern mit einer Matrix. Die Zeilen repräsentieren Nutzer, die Spalten repräsentieren Objekte. Jede Zelle enthält eine Bewertung oder ist leer. Das Ziel: die leeren Zellen möglichst präzise vorhersagen.

Beispiel: Ein Filmportal mit 10.000 Nutzern und 5.000 Filmen hat eine Matrix mit 50 Millionen Zellen. Typischerweise sind davon weniger als 1% gefüllt. Ein durchschnittlicher Nutzer bewertet vielleicht 80 Filme von 5.000.

Diese Dünnbesetztheit (Sparsity) ist das zentrale technische Problem. Je weniger Zellen gefüllt sind, desto schwieriger ist es, zuverlässige Ähnlichkeiten zu berechnen. Zwei Nutzer, die nur drei gemeinsam bewertete Filme haben, liefern eine instabile Schätzung.

Beispiel: Zwei Nutzer bewerten beide den Film "Inception" mit 5 Sternen. Daraus lässt sich wenig ableiten. Haben sie 40 gemeinsam bewertete Filme und stimmen in 35 davon überein, ist die Ähnlichkeit statistisch belastbar.

NutzerBewertungen, Klicks

BewertungsmatrixNutzer x Objekte

ÄhnlichkeitKosinus, Pearson

VorhersageFehlende Bewertungen

EmpfehlungTop-N Liste

Matrixfaktorisierung: latente Muster aufdecken

Ein leistungsfähiger Ansatz innerhalb des Collaborative Filtering zerlegt die Bewertungsmatrix in kleinere Matrizen. Dieses Verfahren heißt Matrixfaktorisierung. Es identifiziert latente Faktoren, die weder explizit definiert noch direkt beobachtbar sind.

Beispiel: Nach der Faktorisierung könnte ein latenter Faktor mit Action-Filmen korrelieren, ein anderer mit europäischem Arthouse-Kino. Kein Mensch hat diese Kategorien definiert. Sie ergeben sich aus den Bewertungsmustern.

Mathematisch wird die Matrix R (Nutzer x Objekte) approximiert durch das Produkt zweier kleinerer Matrizen: R ≈ U · Vᵀ. U beschreibt die Nutzer in Bezug auf die latenten Faktoren, V beschreibt die Objekte. Die Dimension der latenten Faktoren (typischerweise 20 bis 200) bestimmt die Komplexität des Modells.

Beispiel: Der Netflix Prize (2006 bis 2009) zeigte die Wirksamkeit von Matrixfaktorisierung. Das Gewinnerteam verbesserte die Vorhersagegenauigkeit gegenüber dem bisherigen Netflix-Algorithmus um 10,06%. Die Lösung kombinierte mehrere Matrixfaktorisierungsmodelle mit Nachbarschaftsmethoden.

Moderne Varianten nutzen Deep Learning. Autoencoder und neuronale Netze können nichtlineare Zusammenhänge in den Bewertungsdaten abbilden, die lineare Faktorisierung nicht erfasst.

Explizite und implizite Signale

Nicht jede Nutzerinteraktion ist gleich aussagekräftig. Collaborative Filtering unterscheidet zwischen expliziten und impliziten Signalen.

Explizite Signale sind direkte Bewertungen: Sterne, Daumen hoch oder Daumen runter, Schulnoten. Der Nutzer drückt eine bewusste Präferenz aus.

Beispiel: Ein Nutzer bewertet einen Film mit 4 von 5 Sternen. Diese Information ist eindeutig interpretierbar. Der Nutzer fand den Film gut, aber nicht herausragend.

Implizite Signale entstehen als Nebenprodukt der Nutzung: Verweildauer, Scrolltiefe, Wiederkäufe, Abbruchzeitpunkte. Sie sind reichhaltiger, aber mehrdeutig.

Beispiel: Ein Nutzer schaut 90% einer Serie. Bedeutet das Interesse oder Langeweile (weil er bei 90% abgebrochen hat)? Ein Nutzer klickt auf ein Produkt und kehrt sofort zurück. Das impliziert Desinteresse, nicht Interesse.

In der Praxis dominieren implizite Signale, weil nur ein Bruchteil der Nutzer aktiv bewertet. Systeme wie YouTube und Spotify stützen sich fast ausschließlich auf implizites Feedback: Abspielzeit, Skip-Rate, Wiederholungen. Die Modellierung impliziter Daten erfordert andere Optimierungsverfahren als explizite Bewertungen, etwa gewichtete Verlustfunktionen statt klassischer Fehlerminimierung.

Das Kaltstart-Problem

Collaborative Filtering hat eine strukturelle Schwäche: Es benötigt Daten, um Daten zu empfehlen. Ohne Interaktionshistorie keine Empfehlung. Diese Situation heißt Kaltstart (Cold Start).

Das Problem betrifft zwei Seiten: neue Nutzer und neue Objekte.

Beispiel: Ein neuer Nutzer registriert sich bei einem Musikdienst. Das System hat keine Abspielhistorie. Es kennt weder Genre-Präferenzen noch Tempovorlieben. Ohne Verhaltensdaten kann der Algorithmus keine ähnlichen Nutzer identifizieren.

Beispiel: Ein neuer Song wird auf die Plattform geladen. Kein Nutzer hat ihn bisher abgespielt. Egal wie gut er zu bestimmten Hörern passen würde: Im rein kollaborativen Modell existiert er nicht, weil keine Interaktion vorliegt.

Praxislösungen kombinieren Collaborative Filtering mit inhaltsbasierten Verfahren (Hybrid-Ansätze). Neue Nutzer erhalten zunächst Empfehlungen auf Basis demografischer Merkmale oder expliziter Präferenzangaben. Neue Objekte werden über ihre Metadaten (Genre, Künstler, Schlagworte) eingeordnet, bis genügend Interaktionsdaten vorliegen.

Skalierung und algorithmische Herausforderungen

Produktionssysteme arbeiten mit Millionen von Nutzern und Objekten. Die Bewertungsmatrix eines großen E-Commerce-Systems hat Milliarden potenzieller Einträge. Naive Implementierungen, die jede Nutzerkombination paarweise vergleichen, sind bei dieser Größenordnung nicht praktikabel.

Beispiel: Ein System mit 100 Millionen Nutzern hätte bei paarweisem Vergleich 5 x 10¹⁵ Nutzerpaare zu berechnen. Selbst bei Millisekunden pro Paar wäre die Berechnung nicht in vertretbarer Zeit abschließbar.

Lösungsansätze umfassen: Approximate Nearest Neighbor (ANN) Verfahren, die Ähnlichkeitssuche auf Sublinearzeit reduzieren. Dimensionsreduktion durch Embeddings, die Nutzer und Objekte in dichten, niedrigdimensionalen Vektorräumen abbilden. Und verteilte Berechnung auf Clustern, die die Matrix in Blöcke zerlegen und parallel verarbeiten.

Beispiel: Spotify nutzt Approximate Nearest Neighbor Verfahren, um aus über 600 Millionen Nutzern in Echtzeit ähnliche Hörerprofile zu finden. Die Berechnung geschieht in einem hochdimensionalen Embedding-Raum, nicht über die rohe Bewertungsmatrix.

Hybride Systeme und Verbindung mit inhaltsbasierten Verfahren

In der Praxis setzen wenige Systeme ausschließlich auf Collaborative Filtering. Die meisten Empfehlungssysteme kombinieren kollaborative Signale mit inhaltsbasierten Merkmalen. Diese Hybrid-Architektur nutzt die Stärken beider Ansätze.

Beispiel: Netflix kombiniert Collaborative Filtering ("Nutzer mit ähnlichem Sehverhalten mochten auch ...") mit Content-Based Filtering ("Dieser Film hat ähnliche Schauspieler, Regisseure und Genre-Tags"). Die Gewichtung der Signale variiert je nach Datenlage: Bei neuen Nutzern dominieren inhaltsbasierte Merkmale, bei langjährigen Nutzern die kollaborativen Signale.

Hybride Architekturen lösen mehrere Probleme gleichzeitig: Sie mildern den Kaltstart ab, erhöhen die Diversität der Empfehlungen und reduzieren die Abhängigkeit von Interaktionsdichte.

Beispiel: Ein Nachrichtenportal empfiehlt Artikel über den Inhalt (Thema, Entitäten, Aktualität) und über kollaborative Signale (welche Artikel lesen Nutzer mit ähnlichem Leseprofil). Die Kombination verhindert, dass Nutzer nur ältere, bereits viel gelesene Artikel empfohlen bekommen.

Grenzen und offene Probleme

Collaborative Filtering erzeugt systematische Verzerrungen. Beliebte Objekte werden überproportional empfohlen (Popularitäts-Bias). Nischenprodukte erhalten weniger Interaktionen und werden dadurch seltener in Ähnlichkeitsberechnungen berücksichtigt.

Beispiel: Ein Buchportal empfiehlt Bestseller häufiger als Fachbücher mit kleiner Leserschaft. Nicht weil die Bestseller besser passen, sondern weil mehr Bewertungsdaten vorliegen. Die statistische Basis ist breiter, die Empfehlung stabiler.

Die Filterblasen-Problematik entsteht, wenn das System immer ähnlichere Nutzergruppen bildet. Die Empfehlungen konvergieren. Nutzer sehen zunehmend das, was sie bereits kennen. Techniken wie Exploration-Exploitation-Balancing oder bewusst injizierte Zufälligkeit wirken dem entgegen, erfordern aber Kompromisse bei der kurzfristigen Empfehlungsgenauigkeit.

Beispiel: Ein A/B-Test bei einem Streaming-Dienst zeigt: Rein kollaborative Empfehlungen maximieren die kurzfristige Klickrate, aber Nutzer, die gelegentlich unerwartete Vorschläge erhalten, bleiben längerfristig aktiv.

Datenschutz ist ein weiteres offenes Feld. Collaborative Filtering benötigt detaillierte Verhaltensdaten. Die Anonymisierung dieser Daten ist schwieriger als oft angenommen. Forschungsarbeiten haben gezeigt, dass sich Nutzer allein aus Bewertungsmustern re-identifizieren lassen.

Fachliche Einordnung: Collaborative Filtering ist keine abgeschlossene Technologie, sondern ein aktives Forschungsfeld. Offene Probleme umfassen die Fairness von Empfehlungen (bevorzugt das System bestimmte Nutzergruppen?), die Erklärbarkeit (warum genau diese Empfehlung?) und die robuste Evaluation (Offline-Metriken wie RMSE korrelieren nur schwach mit Nutzerzufriedenheit im Echtbetrieb).

Karl Kratz · 25.08.2025 (aktualisiert 03.04.2026)

Technologie Künstliche Intelligenz