데일리픽

갈때까지 가버린 소름돋는 인공지능 근황 TOP3

썸에서연애까지 2022. 7. 17. 17:11
728x90
반응형
728x170

TOP 3 Speech2Face

이 얼굴 사진은 Speech2Face가 서버에 입력된 목소리만을 가지고 생성해낸 것이라고 합니다.

실제 목소리의 주인과 비교해보면 놀랍도록 흡사한 모습을 확인할수 있죠.

미국 매사추세츠 공과대학의 과학자들은 유튜브 동영상 수백만개를 분석해 사람의 얼굴과 목소리의 관계를 연구해 개발에 성공했습니다.

우리가 말을 할때 얼굴의 뼈가 일종의 확성기 역할을 한다고 하는데요. 이 때문에 목소리의 파형을 분석해 대략적인 형체를 알아낼 수 있기 때문에 외형을 그려낼 수 있다고 합니다.

SNS에서 유행했던 얼굴합성앱 ‘FACE APP’ 역시 이 기술을 적용한 것이라고 하는데요. 자연스러운 표현력에 모두 놀라움을 금치 못했죠.

연구진들은 Speech2Face를 다른 응용프로그램들에도 활발히 활용할 예정이라고 하니, 목소리만 남은 범인을 검거할 수 있는 날도 머지 않은 것 같습니다.

TOP 2 DALL-E 2

지금 보시는 이 그림은 ‘슈퍼 프린세스 피치의 애니메이션 키 비주얼’이라는 문장만 듣고 인공지능이 그려낸 그림인데요.

이 그림을 그린 인공지능은 DALL-E 2로 수많은 이미지와 언어간의 관계를 학습해 사용자가 원하는 그림을 그려낸다고 하죠.

일론 머스크가 샘 알트만과 공동 설립한 OPENAI에서 개발한 DALL-E 2는 해상도 문제가 있던 전작의 단점을 보완해 출시된 기술이라고 합니다.

게다가 실제 디자이너와 협의를 주고 받는 것 처럼 추가적인 텍스트 입력을 통해 완성된 그림을 수정할 수도 있다고 하는데요.

이 기술은 현재 국내외에서 많은 관심을 받고 있는데요. 그중 카카오 역시 오픈AI DALL-E 2를 활용한 멀티모달 기술을 공개하기도 했습니다.

텍스트 명령어 입력시 적절한 이미지를 그리는 식의 이미지 텍스트 쌍방향 핸들링 방식은 국내에서 카카오가 두 번째라고 하네요.

현재는 아쉽게도 실존인물을 대상으로 하는 등의 악용을 방지하기 위해 허가를 받은 사람들만 사용이 가능하다는데요.

대신 성능이 떨어지는 마이너 버전, Dalle-mini는 웹 사이트를 통해 체험할 수 있다고 하니 한 번 재미삼아 사용해봐도 좋겠네요!

TOP 1 GPT-3

과학자들이 안데스 산맥의 외딴 계곡에서 유니콘 무리를 발견했다는 황당한 뉴스, 들어보신 적 있으신가요?

마치 실제와 비슷한 이 뉴스는 “과학자들이 유니콘 무리를 발견했다” “유니콘은 완벽한 영어를 구사했다” 를 제시받은 인공지능이 직접 만든 것이라고 하죠.

인공지능이 만든 뉴스가 자연스러운 이유는 AI가 유니콘을 발견한 인간의 감정을 이해하고 상상해내는데 성공했기 때문입니다.

이 글을 써낸 인공지능 GPT-3는 앞서 소개해드린 DALL-E를 개발한 OPEN AI가 만든 인공지능인데요.

딥러닝을 통해 막대한 양의 정보를 흡수한 것을 바탕으로 사람과 비슷한 글을 써내려갈 수 있는 능력을 갖췄다고 하죠.

몇개의 문장만으로 그럴듯한 글을 인간보다 훨씬 빠르게 쓸 수 있는 탓에 일각에서는 가짜뉴스를 찍어내게 되는 것 아니냐. 는 우려도 있었지만,

OPEN AI 측에서는 ‘지금까지는 오용에 대한 강력한 증거가 나타나지 않았다.’라며 해당 AI를 공개했죠.

악용되지만 않는다면 GPT-3를 활용해 블로그 게시물이나 제품 설명을 작성하는 등의 좋은 점들도 많을 것으로 예상되고 있습니다.

이제는 단순 글쓰기를 넘어 gpt-3를 기반으로 만들어진 Codex를 통해 코딩분야까지 넘보고 있다는 인공지능!

이제는 문과 이과 모두 인공지능에 정복당하는게 아닐지 모르겠습니다

728x90
반응형
그리드형