딥페이크 제프 베조스 음성이 포함된 시애틀 신호등 신호, 휴대폰으로 해킹 가능성 제기
1 min read
이미지 출처:https://www.kuow.org/stories/seattle-jeff-bezos-deepfake-ai-crosswalks-hacked-cellphone
최근 서부 해안 여러 도시에서 기술 억만장자들에 대한 시위가 잇따르고 있다.
하지만 이러한 시위는 간단한 팻말이나 행진 형식이 아니다.
신호등이 해킹되어 보행자가 교차로 버튼을 누르면 억만장자들의 풍자적인 인상이 담긴 음성이 재생되고 있다.
시애틀의 최소 다섯 개 교차로에서는 지난주 다음과 같은 메시지가 재생됐다.
“안녕하세요, 저는 제프 베조스입니다. 이 신호등은 아마존 프라임이 후원하며 중요한 메시지를 전합니다.
부자에게 세금을 부과하지 말아 주세요, 그렇지 않으면 다른 모든 억만장자들도 플로리다로 이주할 것입니다.”
이 목소리는 아마존의 창립자인 제프 베조스의 목소리처럼 들린다.
기술 전문가들은 이것이 아마 생성 인공지능(GAI)일 가능성이 높다고 말하고 있다.
시애틀에서는 이 베조스 녹음이 코미디언 보 번햄의 노래로 끝났다.
시애틀 교통국(SDOT)에 따르면, 신호등은 해킹되어 이러한 메시지를 재생하고 있었다.
시애틀 외에도 이러한 일이 발생한 지역이 있다.
실리콘 밸리에서는 일부 신호등이 메타의 마크 저커버그와 테슬라의 일론 머스크처럼 들리는 음성을 재생한 것으로 보고되었다.
아마존, 메타, 테슬라는 논평 요청에 응답하지 않았다.
워싱턴 대학교 학생인 에바 박자드는 이 장난이 웃겼다고 전했다.
“정말 웃겨요,” 박자드는 말했다.
“그리고 누군가가 할 수 있는 일을 한다는 것이 좋습니다.”
삼 개의 조작된 신호등은 유니버시티 디스트릭트에 있었고, 또 하나는 아마존 본사 근처의 사우스 레이크 유니온에 있었다.
아마존에서 일하는 많은 직원들은 가짜 메시지에 대해 이야기하고 싶어하지 않았다.
하지만 아마존 HQ 근처의 한 레스토랑에서 일하는 메이슨 메이스는 이 신호등 장난에 대해 팬이 아니라고 전했다.
“[그것은] 정말 이상하고 비정상적이에요,” 메이스는 말했다.
“왜냐하면 지금 아무것도 해킹될 수 있거든요.
우리의 신호등이 해킹될 수 있다면, 무엇이든 해킹될 수 있습니다.”
누가 해킹의 책임을 지고 있는지는 분명하지 않다.
SDOT는 이것이 어떻게 발생했는지 또는 누가 했는지에 대한 정확한 정보를 제공하지 않았다.
SDOT의 대변인은 KUOW에 보낸 이메일에서 해킹된 것으로 보이는 일부 신호등의 통신을 일시적으로 끄겠다고 전했다.
그들은 또한 신호등 버튼 공급업체와 협력하여 보안을 강화할 것이라고 밝혔다.
워싱턴 대학교의 보안 및 개인정보보호 연구소 공동책임자인 데이비드 콜브레너는 이것이 그리 어려운 일이 아닐 것이라고 말했다.
“그들은 그리 안전하지 않습니다. 그건 의도된 것입니다,” 콜브레너는 말했다.
“이들의 목적은 사용이 빠르도록 하는 것입니다.
현장에서 사람들에게 사용하기 쉽게 하려고 복잡성을 많이 두지 않으려 합니다.”
그는 각 신호등 신호에 스마트폰 앱과 블루투스로 로그인할 수 있다고 강조했다.
이는 도시가 신호를 빠르게 수리하거나 특정 신호등의 오디오를 업데이트할 수 있도록 하는 것이다.
로그인하기 위해서는 비밀번호만 필요하다.
콜브레너는 이 사건의 경우, 신호가 제조업체의 기본 비밀번호를 사용했을 가능성이 있다고 언급했다.
“그래서 기본 비밀번호를 변경하지 않으면, 그냥 걸어가서 장치에 연결하고 원하는 음성 파일을 업로드할 수 있습니다,” 그가 말했다.
작년 12월, 사우스 레이크 유니온에서는 비슷한 일이 발생했을 때 공사 도로 표지판이 반 CEO 메시지를 표시하도록 해킹됐다.
“이러한 인프라 중 많은 부분이 의도적으로 악의적인 공격으로부터 보호를 위해 설계된 것이 아닙니다,” 콜브레너는 덧붙였다.
“우리는 사람들이 합리적인 시민이 될 것이라고 믿고 있습니다.”
이 장난을 가능하게 한 AI 기술과 관련하여, UW 연구의 세실리아 아라고는 이것도 상당히 간단하다고 설명했다.
“그들이 필요로 하는 것은 이 사람의 목소리 샘플 몇 개만 있습니다,” 아라고는 말했다.
“기본적으로 기록된 적이 있고 반공식적인 인물은 이러한 유형의 사기에 취약합니다.”
아라고는 이를 음성 클로닝이라고 불렀다.
오디오 샘플이 몇 개만 있으면 AI가 특정 사람의 언어 패턴, 억양 및 억양을 학습할 수 있다고 설명했다.