LLM ist ein Akronym für „Large Language Models“ und beschreibt KI-Modelle auf Basis großer Sprachmodelle. Diese Sprachmodelle werden mit Petabytes an Daten trainiert und sollen menschliche Sprache und Texte imitieren können. Vertreter dieser Art sind unter anderem ChatGPT, DeepSeek, Google Gemini oder Microsoft Copilot. Mit LLMjacking versuchen Angreifer nicht nur an vertrauenswürdige Daten zu gelangen, sondern wollen auch den Anbietern schaden.
Wie LLMjacking funktioniert
Die Angriffsmethode erinnert entfernt an klassische Cloudangriffe. Das begehrte Ziel stellen dabei die Ressourcen für KI-Modelle dar. Um an die Daten zu kommen, stehlen die Kriminelle Zugangsdaten mittels Phishing-Angriffe auf unbedarfte Nutzer (teilweise gelingt es den Angreifern an die API-Schlüssel zu gelangen).
Dabei versenden sie gefälschte E-Mails, mit Links, die die Nutzer auf gefälschte Anmeldeseiten führen. Gelingt der Angriff, können sich die Kriminellen ungehindert Zugang verschaffen, wo sie die Rechenleistung für eigene Projekte nutzen (beispielsweise dem Training eines eigenen KI-Modells) und dem Betreiber einen finanziellen Schaden hinterlassen.
In der Regel haben es die Kriminellen auf neue KI-Modelle abgesehen, wie ein Bericht von Sysdig im Falle von DeepSeek zeigt. Unternehmen, die Künstliche Intelligenz einsetzen oder aber selbst ein Modell entwickeln, sollten im selben Zug geeignete Sicherheitsmechanismen (wie eine Multi-Faktor-Authentifizierung) installieren. Weiterhin sollten API-Schlüssel niemals fest im Code hinterlegt sein.
Wie weit sind europäische KI-Modelle?
Während die meisten Anbieter aus den USA kommen und im Bereich Datenschutz als bedenklich gelten, gibt es mit Teuken-7B (herunterladbar auf Hugging Face) einen europäischen Ansatz. Die europäische KI ist seit 2022 in Entwicklung und komplett kostenlos, da es sich um ein öffentliches Forschungsprojekt handelt, das im Einklang mit dem europäischen Ansatz für künstliche Intelligenz entwickelt wird.
Aktuell wird die künstliche Intelligenz mit sieben Milliarden Parametern (zum Vergleich ChatGPT 4o kann auf 200 Milliarden Parameter zurückgreifen) gefüttert und soll 24 Amtssprachen der Europäischen Union verstehen beziehungsweise wiedergeben können. Beteiligt an dem Projekt sind unter anderem die TU Dresden, das Forschungszentrum Jülich sowie die Unternehmen Aleph Alpha und IONOS SE.
Quelle(n)
Europäische Kommission via Heise (Deutsch), IT-Daily (Deutsch), The Washington Post (Englisch) Hugging Face (Englisch), Bildquelle: Pixabay / tungnguyen0905