ChatGPT gehackt: GPT-4 zu schwerwiegenden illegalen Handlungen verleitet

OpenAIs ChatGPT wurde von Sicherheitsexperten gehackt (Bild: Robert Klank / Unsplash, bearbeitet)

ChatGPT konnte mit Hilfe von Prompts gehackt und zu illegalen Handlungen verleitet werden. Dies bewies der Sicherheitsexperte Alex Polyakov, der nur wenige Stunden benötigte, um GPT-4, die neueste Version des Chatbots von OpenAI, zu knacken. Mit einem universellen Jailbreak können nun auch die Sicherheitsvorschriften anderer LLMs wie Bing von Microsoft oder Bard von Google umgangen werden.

Nicole Dominikowski, Veröffentlicht am 19.04.2023

AI Security Business

Sicherheitsexperten haben es geschafft ChatGPT, sowie andere generative KI dazu zu bewegen illegale Handlungen vorzunehmen. Der Sicherheitsspezialist Polyakov experimentierte mit verschiedenen Prompts, um OpenAIs GPT-4 zu unerlaubten Aktionen zu verleiten - mit Erfolg. Das Interessante daran: Das System wird nicht mit Codes gehackt, sondern hauptsächlich mit Prompts, also Aufforderungen in natürlicher Sprache. Um die KI zu illegalen Handlungen zu bewegen, arbeitet Polyakov die Prompts bis ins kleinste Detail aus, um Schwächen im System auszunutzen.

So gelang es dem CEO der Sicherheitsfirma Adversa AI, die KI dazu zu bringen, sich homophob zu äußern, Phishing-E-Mails zu verfassen und Gewalt zu befürworten. Außerdem konnte ChatGPT dazu gebracht werden, Rezepte für die Herstellung von Meth sowie detaillierte Anweisungen zum Kurzschließen von Autos preiszugeben. Das Experiment soll zeigen, dass künstliche Intelligenz dazu trainiert werden kann, jede Art von böswilligen Anweisungen bloßzulegen.

Der Prozess, Prompts zu entwerfen, die den Chatbot dazu bringen, Regeln zu umgehen, wird als Jailbreaking bezeichnet. Bisher wurde Jailbreaking eher dazu genutzt, um beispielsweise iPhones die Installation von nicht von Apple genehmigten Apps zu ermöglichen. Polyakov entwickelte sogar einen universellen Jailbreak gegen unterschiedlichste große Sprachmodelle wie etwa Bing von Microsoft, Bard von Google und Claude von Anthropic.

Sicherheitsexperten warnen vor einer zu schnellen Verbreitung der generativen KI, da dadurch das Risiko von Datendiebstahl und anderer Cyberkriminalität erhöht würde. Darüber hinaus wird diese Art von Cyber-Angriffen wesentlich schwieriger zu erkennen und zu verhindern sein:

Once enterprises will implement AI models at scale, such ‘toy’ jailbreak examples will be used to perform actual criminal activities and cyberattacks, which will be extremely hard to detect and prevent.

- Alex Polyakov

Quelle(n)

Wired, Bild: Robert Klank / Unsplash (bearbeitet)

Verwandte Artikel

Sicherheitslücken in den Open-Source-Diensten drängen zum Server-Update (Bild: Nextcloud/Owncloud)

Sicherheitslücken in Cloud-Software Nextcloud und ownCloud entdeckt 04.12.2023

BrutePrint: Fingerabdrucksensoren lassen sich überwinden - mit Aufwand (Bild: George Prentzas)

BrutePrint: Fingerabdrucksperre von Android-Smartphones lässt sich überlisten, iPhones sind sicher 23.05.2023

Cyberangriffe: Risiko so hoch wie nie 22.05.2023

Nach einem ChatGPT-Datenleck will Samsung die Chatbot-Nutzung durch Mitarbeiter unterbinden. (Bild: Viralyft)

Samsung verbietet Mitarbeitern Nutzung von ChatGPT, entwickelt eigene KI 02.05.2023

Microsoft will künftig eigene ARM-Chips entwickeln, statt Qualcomm Snapdragon-SoCs zu verbauen. (Bild: Microsoft)

Gerücht: Microsoft entwickelt ARM-Prozessor und Windows 12 als Konter zum Apple M2 02.05.2023

OpenAIs ChatGPT soll Krankenhaus-Personal vorm Bunrnout schützen (Bild: UCSD, bearbeitet)

Ärzte nutzen ChatGPT, um Patientenfragen zu beantworten: KI arbeitet laut Studie besser als menschliches Personal 01.05.2023

ChatGPT wurde in Roboter-Hund Spot integriert (Bild: Boston Dynamics)

Video: ChatGPT wurde in einen Roboter-Hund integriert und kann jetzt sprechen 26.04.2023

Masimo wirft Apple vor, die Technologie für den Blutsauerstoff-Sensor der Apple Watch gestohlen zu haben. (Bild: Apple)

Apple soll SpO2-Sensor für Apple Watch gestohlen haben, laut Anschuldigungen von Masimo 25.04.2023

Apple soll KI-Features entwickeln, welche iPhone-Nutzer dabei unterstützen, gesünder zu leben. (Bild: Apple)

Bloomberg: Apple iPhone erhält mit iOS 17 Stimmungs-Tracking und KI-Gesundheits-Coach 25.04.2023

Der LattePanda Sigma verspricht eine enorme Performance für den Einsatz als Gaming- oder Smart-Home-Server. (Bild: LattePanda)

LattePanda Sigma packt Intel Raptor Lake-P und Thunderbolt 4 auf Single-Board-Computer 25.04.2023

Das 32 Zoll Pro Display XDR ist der größte Monitor, den Apple je angeboten hat. (Bild: James McDonald)

Gerücht: Apple plant 32 Zoll und 42 Zoll OLED-Monitore, 20 Zoll iPad Fold und OLED-MacBooks 24.04.2023

Die aktuellen großen Sprachmodelle werden häufig als Stochastik Parrot (Stochastik-Papagei) kritisiert (Bild: Stability AI)

Stability AI: Macher von Stable Diffusion veröffentlichen GPT-Alternative 21.04.2023

YouTuber Marques Brownlee packt ein originalverpacktes iPhone 2G aus, und verliert damit fast 40.000 US-Dollar. (Bild: Marques Brownlee, YouTube)

YouTuber packt 40.000 US-Dollar teures, versiegeltes Apple iPhone Classic aus 21.04.2023

Das Google Pixel 7a soll per Gesichtserkennung entsperrt werden können, genau wie das Pixel 7 und das Pixel 7 Pro. (Bild: @OnLeaks / MySmartPrice)

Google Pixel 7a unterstützt Face Unlock, laut geleakter Screenshots 21.04.2023

Das 15 Zoll MacBook Air soll den Launch des Apple M3 verpassen, und noch mit dem M2 aus dem Vorjahr auf den Markt kommen. (Bild: James Yarema)

Gerücht: 15 Zoll MacBook Air startet in zwei Versionen, verpasst aber den Apple M3 20.04.2023

Das Google Pixel Tablet soll in Kürze auf den Markt kommen, wird aber nicht günstig. (Bild: Google)

Google Pixel Tablet soll teurer als Apple iPad 10 werden, Gerüchte nennen Preise und Speicher-Ausstattung 20.04.2023

Die Docking-Station lädt das Google Pixel Tablet, das magnetisch gehalten wird. (Bild: Google)

Google Pixel Tablet Dock leakt auf Amazon samt Preis 19.04.2023

Das Apple iPhone 15 Pro Max soll erstmals eine Periskop-Tele-Kamera mit längerer Brennweite erhalten. (Bild: 9to5Mac)

Gerücht: Apple iPhone 15 Pro Max erhält Periskop-Tele-Kamera mit gleicher Brennweite wie Xiaomi 13 Ultra 19.04.2023

Das Huawei P60 Pro setzt auf eine Periskop-Tele-Kamera mit Makro-Funktion. (Bild: Huawei / @MrDengLi, bearbeitet)

Huawei P60 Pro: Eindrucksvolle Fotos zeigen Vorzüge der Periskop-Makro-Kamera 19.04.2023

Elon Musk will eine künstliche Intelligenz entwickeln, die der Wahrheit Priorität einräumt. (Bild: Debbie Rowe / Nice M Nshuti)

Elon Musk kündigt Entwicklung von TruthGPT an 18.04.2023

Microsoft SwiftKey kann Antworten nun durch eine künstliche Intelligenz umformulieren. (Bild: Microsoft)

Microsoft SwiftKey-Tastatur für Apple iPhone erhält ChatGPT-Integration 17.04.2023

Cool Pi CM5: Neue Alternative zum Raspberry Pi mit KI-Beschleunigung 16.04.2023

Ein Bild von einem Amazon-ChatBot, das von Dall-e 2 von OpenAI erstellt wurde

Amazon kündigt mit Bedrock eine Alternative zu ChatGPT an 14.04.2023

ChatGPT und KI: Für Mehrheit der Unternehmen die größte Revolution seit dem Smartphone 12.04.2023

KI-Bier Autonomous: Beck's braut Bier nach KI-Rezeptur von ChatGPT, Branding von Midjourney 11.04.2023

Alle 20 Beträge lesen / Antworten

Loading Comments

Diesen Artikel kommentieren / Antworten

Renault Clio: Neuer Vollhybrid ab J...

EcoFlow Glacier: Akkubetriebene Küh...

Nicole Dominikowski - Tech Writer - 1056 Artikel auf Notebookcheck veröffentlicht seit 2022

Zukunftsszenarien und fiktive Welten faszinieren mich, weshalb ich mich gerne mit Themen wie etwa AI, AR und Gaming beschäftige und auf Notebookcheck dazu schreibe. Um mich diesen Gebieten vertieft zu widmen, studierte ich nach meiner Gesellenzeit als Gold-und Silberschmiedin Design, Digitale Medien und Kunst. In meiner Freizeit mache ich außerdem Musik und verbringe viel Zeit in der Natur mit meinen Hunden.

Kontakt: @nicdominikowski

Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!

> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2023-04 > ChatGPT gehackt: GPT-4 zu schwerwiegenden illegalen Handlungen verleitet

Autor: Nicole Dominikowski, 19.04.2023 (Update: 19.04.2023)