Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

Knowledge Science - Alles über KI, ML und NLP

03-07-2024 • 29 mins

In dieser faszinierenden Episode erkunden Sigurd Schacht und Carsten Lanquillon, wie Anthropic's Forschung zur Interpretierbarkeit von KI es ermöglicht, Sprachmodelle auf Konzeptebene zu manipulieren. Sie diskutieren das aufsehenerregende Golden Gate Claude-Experiment, bei dem ein Sprachmodell dazu gebracht wurde, in jeder Konversation die Golden Gate Bridge zu erwähnen, und erörtern die weitreichenden Implikationen dieser Technologie für die Zukunft der KI-Steuerung und -Sicherheit.

Support the show

You Might Like

Darknet Diaries

Darknet Diaries

Jack Rhysider

BBC Inside Science

BBC Inside Science

BBC Radio 4

Tech and Science Daily | The Standard

Tech and Science Daily | The Standard

The Evening Standard

The PC Pro Podcast

The PC Pro Podcast

PC Pro

TED Radio Hour

NPR

This Week in Tech (Audio)

This Week in Tech (Audio)

TWiT

Lofi ~ Sleep/Chill

Lofi ~ Sleep/Chill

Lofi King

Double Tap

Double Tap Productions Inc.

Elon Musk Podcast

Elon Musk Podcast

Stage Zero

Acquired

Ben Gilbert and David Rosenthal

Hard Fork

The New York Times

All-In with Chamath, Jason, Sacks & Friedberg

All-In with Chamath, Jason, Sacks & Friedberg

All-In Podcast, LLC

AI Chat: ChatGPT & AI News, Artificial Intelligence, OpenAI, Machine Learning

AI Chat: ChatGPT & AI News, Artificial Intelligence, OpenAI, Machine Learning

Jaeden Schafer

TechStuff

iHeartPodcasts

The Vergecast

The Verge

This Week in Retro

This Week in Retro

Neil from RMCretro - The Cave, Chris from 005 AGIMA and Dave

Waveform: The MKBHD Podcast

Waveform: The MKBHD Podcast

Vox Media Podcast Network

RNIB Tech Talk

RNIB Connect Radio

Security Now (Audio)

Security Now (Audio)

TWiT

Talkin' Shop

Eclipse Automotive Technology