Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

Knowledge Science - Alles über KI, ML und NLP

03-07-2024 • 29 mins

Send us a text

In dieser faszinierenden Episode erkunden Sigurd Schacht und Carsten Lanquillon, wie Anthropic's Forschung zur Interpretierbarkeit von KI es ermöglicht, Sprachmodelle auf Konzeptebene zu manipulieren. Sie diskutieren das aufsehenerregende Golden Gate Claude-Experiment, bei dem ein Sprachmodell dazu gebracht wurde, in jeder Konversation die Golden Gate Bridge zu erwähnen, und erörtern die weitreichenden Implikationen dieser Technologie für die Zukunft der KI-Steuerung und -Sicherheit.

Support the show

You Might Like

Darknet Diaries
Darknet Diaries
Jack Rhysider
Double Tap
Double Tap
Double Tap Productions Inc.
Acquired
Acquired
Ben Gilbert and David Rosenthal
Hard Fork
Hard Fork
The New York Times
TechStuff
TechStuff
iHeartPodcasts
The Vergecast
The Vergecast
The Verge
This Week in Retro
This Week in Retro
Neil from RMCretro - The Cave, Chris from 005 AGIMA and Dave
Waveform: The MKBHD Podcast
Waveform: The MKBHD Podcast
Vox Media Podcast Network
RNIB Tech Talk
RNIB Tech Talk
RNIB Connect Radio
Talkin' Shop
Talkin' Shop
Eclipse Automotive Technology