데이터사이언티스트라면 반드시 한 번쯤 고민해야 할 내용
오늘날 인공지능(AI) 기술은 국가나 기업 등의 의사 결정을 빠르게 가속할 수 있는 획기적인 기술로 꼽힌다.
방대한 데이터에서 유용한 정보를 뽑아내는데 여러 사람이 오랜 시간에 걸쳐 복잡한 연구와 토론을 거쳐야만 했던 것을 매우 짧은 시간에 도출할 수 있기 때문이다.
특히 주어진 데이터만으로 스스로 학습해 목표한 결과를 스스로 찾아내는 AI 모델을 만들 수 있는 머신러닝은 데이터 사이언스 분야의 꽂이라 할 수 있다.
하지만, AI 기술이 빠르게 발전하고, 본격적으로 정부의 정책 수립, 기업의 새로운 사업 추진, 각종 시뮬레이션과 분석 연구의 정확도 향상 등에 적용되기 시작한 이후 문제도 발생하기 시작했다. 익명 속에 숨겨졌던 개인 정보의 노출, 공정하지 못한 편향된 AI 모델의 발생 등 미처 예상하지 못했던 심각하고 중요한 문제들이 속속 발견되고 있다.
이러한 데이터 기반 AI 모델에서 발생하는 문제들은 단순히 데이터에서 목적한 결과를 도출할 수 있도록 설계한 ‘알고리즘’의 개선만으로는 해결할 수 없다. 지금까지 축적된 데이터만으로는 아무리 알고리즘을 잘 설계해도 민감한 개인 정보를 침해하거나, 공정하지 않고 좋지 않은 쪽으로 편향된 AI 모델이 발생할 수 있기 때문이다.
민감한 개인 정보를 보호하면서 정확도 높은 결과만 도출할 수 있거나, 보편적 관점에서 공평하고 정당하며 치우치지 않은 AI 모델을 개발하기 위해서는 단지 수학적인 접근법과 컴퓨터 공학적인 접근법만으로 부족하다. 알고리즘과 이에 기반한 머신러닝은 사람처럼 스스로 선악을 구별하고, 공정함을 구분할 수 있는 스스로의 기준이 없기 때문이다.
이 책은 머신러닝 기반 AI를 개발할 때, 더 안전하고 공정하면서도 정확한 AI 모델을 개발하는 데 도움이 될 수 있도록 다양한 사례와 거기서 발견된 문제점을 소개한다. 최대한 다양한 시점과 관점, 접근법 및 방법론 등을 통해 그런 문제들을 해결할 수 있다는 가능성을 제시한다. 결과적으로 AI의 개발에 있어 ‘사람의 역할’이 얼마나 중요한지 재차 강조한다.
알고리즘 윤리
"안전한 인공지능 알고리즘 설계 기법"
마이클 키언스, 아론 로스 지음 | 이정표 옮김 | 에이콘출판 | 228쪽 | 2만원
#10줄 요약
1. 머신러닝이라고 분류하는 훨씬 복합한 알고리즘은 데이터로부터 자동으로 생성된다. 여기서 사람의 역할은 최종 알고리즘(보통 모델이라고 함)이 데이터로부터 유도되는 절차를 코딩하는 것이며, 모델 자체를 직접 코딩하는 것은 아니다.
2. 머신러닝에서 발생하는 복잡하고 자동화된 의사결정은 설계자의 특성과는 다르게 그 자체의 특성을 갖는다. 이들 모델의 결과가 우리가 지키려는 사회적 규범을 존중하게 하려면, 이러한 목표를 알고리즘에 직접 설계하는 방법을 배워야 한다.
3. 데이터나 알고리즘 규제에 대한 광범위한 요구나 알고리즘의 반사회적 행동에 대한 소비자 및 입법부의 압력, 알고리즘의 해악을 인식하는 일반인의 증가 등의 현상은 과학적 연구의 필요성을 오히려 앞당겨야 한다는 것을 시사한다.
4. 데이터 익명 처리의 역사에서 실패 사례는 수도 없이 많다. 당신에 대한 아주 적은 수의 특정 사실만으로 전 세계 수십억의 사람들 사이에서 또는 대규모의 데이터베이스에서 당신을 충분히 식별할 수 있다는 점이다.
5. 민감한 고객 데이터가 예측 모델을 만드는 데 사용되고, 그 후에는 다양하고 광범위한 주체들에 의해 사용되는 방식으로 ‘공개’돼버리는 시대에 살다보니 프라이버시 보호의 중요성이 급속히 확대됐다.
6. 차분 프라이버시는 데이터 사용을 전면적으로 금지하지 않고도, 실제 데이터를 사용할 수 있게 만드는 가장 강력한 개인 정보 보호 방식 중 하나다.
7. 머신러닝 애플리케이션에서 사용되는 교육용 데이터에는 종종 다양한 종류의 숨겨진(또는 드러난) 편향이 포함되고, 그런 데이터로부터 복잡한 모델을 도출하는 과정에서 편향이 증폭되거나 새로운 편향이 도입된다는 것이다. 설계자가 명확히 명시하지 않으면 머신러닝이 저절로 중립성을 유지하는 경우는 없다는 것이다.
8. 궁극적으로 과학은 정보를 제공해줄 뿐, 어느 수준으로 공정성을 요구할 것인지를 선택하는 것은 항상 인간의 판단과 규범이다. 좋은 알고리즘 설계를 통해 여러 해법을 제시할 수는 있지만, 그중 하나를 선택하는 일은 여전히 사람의 몫이라는 뜻이다.
9. 특정 정보를 사용하지 못하게 하는 방식으로 공정성을 확보하겠다는 발상은 머신러닝 시대와는 맞지 않는 방법이다. 아무리 알고리즘 기반 의사결정 과정에서 특정 정보를 사용하지 못하게 해도, 그 정보를 찾아내어 사용하는 방법이 항상 있기 때문이다.
10. 데이터와 머신러닝이 보편화된 시대에서는 사회적 의사결정을 할 때 공정성과 정확도 간의 상충 관계가 있음을 인정해야 한다.
최용석 기자 redpriest@chosunbiz.com
- 현태호 깃랩 한국 지사장 "단일 데브옵스 플랫폼 깃랩 15, 기업 비즈니스 돕는다"
- [IT 북마당] 개발자에서 아키텍트로 · 데브옵스 도입 전략 외
- 깃랩, 데브옵스 단일 플랫폼 깃랩14 선봬
- [10줄 서평] 피닉스 프로젝트 "위기에 빠진 IT 프로젝트를 구하라"
- [10줄 서평] 개발 함정을 탈출하라…"프로덕트 매니지먼트의 길"
- [10줄 서평] 임태규의 '텐서플로 라이트를 활용한 안드로이드 딥러닝'
- [10줄 서평] 홍성원의 '생각하는 기계 vs 생각하지 않는 인간'
- [10줄 서평] 냉장고를 여니 양자역학이 나왔다
- [10줄 서평] 실리콘밸리 리더십…마이클롭 애플 테크 리더가 꼽은 30가지 리더십 비법
- [10줄 서평] 메타물질로 해리포터의 투명망토를 만들 수 있다고?
- [10줄 서평] 데이터 분석가의 숫자유감…"만화로 배우는 업무 데이터 분석 상식"
- [10줄 서평] 37년 주식투자 전문가가 전하는 합리적 투자의 조건
- [10줄 서평] 자본 생존 전략은 임팩트 투자와 ESG
- [10줄 서평] 메타버스 새로운 기회
- [10줄 서평] 임창환의 브레인 3.0 "인류의 미래는 AI와 뇌공학이 바꾼다"
- [10줄 서평] “김 팀장, 예측이 아니라 추론을 해야죠!"
- [10줄 서평] MBA 마케팅 필독서 45
- [10줄 서평] 김재필의 'ESG 혁명이 온다'
- [10줄 서평] 이재환의 자바 프로그래밍 입문
- [10줄 서평] "AI는 어떻게 기업을 살리는가"…김경준·손진호의 AI 피보팅
- [10줄 서평] 조원경의 '넥스트 그린 레볼루션'
- [10줄 서평] 윤영호의 '그러니까, 영국'
- [10줄 서평] 컨테이너 인프라 환경 구축을 위한 쿠버네티스/도커
- [10줄 서평] 데브옵스 도입 전략
- [10줄 서평] 네이버 스마트스토어 마케팅 시작하기
- [10줄 서평] 개발자에서 아키텍트로…"38가지 실전 훈련법"
- [10줄 서평] 산제이 굽타의 '킵 샤프 늙지 않는 뇌'
- [10줄 서평] 메타버스가 만드는 가상경제 시대가 온다
- [10줄 서평] 데이터 스토리…"데이터를 설득력 있는 이야기로 바꾸는 방법"
- [10줄 서평] 프라이버시 중심 디자인은 어떻게 하는가
- [10줄 서평] 김호섭 등 6인의 '일본, 한국을 상상하다'
- [10줄 서평] 시오노 나나미의 '황제 프리드리히 2세의 생애'
- [10줄 서평] 지금 모빌리티에 투자하라
- [10줄 서평] 린 AI…"비즈니스를 성장시키는 실용적 방법"
- [10줄 서평] AI하라…누구나 AI가 필요한 시대
- [10줄 서평] 비전공자를 위한 첫코딩 챌린지
- [10줄 서평] 윤석남·김이경의 '싸우는 여자들, 역사가 되다'
- [10줄 서평] 최종, 최최종…엑셀 탈출 '구글 스프레드시트 제대로 파헤치기'
- [10줄 서평] Tucker의 Go 언어 프로그래밍
- [10줄 서평] 김규봉·박광혁의 '뜻밖의 화가들이 주는 위안'
- [10줄 서평] 이다혜의 '내일을 위한 내 일'
- [10줄 서평] 존 리의 '부자되기 습관'
- [10줄 서평] 맥 쓰는 사람들을 위한 mac OS 완전정복
- [10줄 서평] 수포자를 위한 '친절한 딥러닝 수학'
- [10줄 서평] 이명호의 디지털 쇼크, 한국의 미래
- [10줄 서평] 김난도의 '마켓컬리 인사이트'
- [10줄 서평] 리처드 윌린의 '하이데거, 제자들 그리고 나치'
- [10줄 서평] 유현준의 '어디서 살 것인가'
- [10줄 서평] 비트코인 창시자, 사토시의 서
- [10줄 서평] 야마구치 슈의 '철학은 어떻게 삶의 무기가 되는가'
- [10줄 서평] 사피 바칼의 '룬 샷'
- [10줄 서평] 자외선이 당신을 늙게 한다
- [10줄 서평] 정여울의 '1일1페이지, 세상에서 가장 짧은 심리수업 365'
- [10줄 서평] 김시덕의 '동아시아, 해양과 대륙이 맞서다'
- [10줄 서평] 곽재식의 '괴물, 조선의 또 다른 풍경'
- [10줄 서평] 유닉스의 탄생
- [10줄 서평] 데이터 쓰기의 기술
- [10줄 서평] 메리 앤 섀퍼, 애니 배로스의 '건지 감자 껍질파이 북클럽'
- [10줄 서평] 홍춘욱의 '50대 사건으로 보는 돈의 역사'
- [10줄 서평]이철승의 '쌀 재난 국가'
- [10줄 서평] 김용섭의 프로페셔널 스튜던트
- [10줄 서평] 이동륜의 인간교
- [10줄 서평] 임홍택의 '관종의 조건'
- [10줄 서평] 홍일립의 국가의 딜레마
- [10줄 서평] 임동근, 김종배의 '메트로폴리스 서울의 탄생'
- [10줄 서평] 미국 외교의 거대한 환상
- [10줄 서평] 이형재의 '직장인 공부법'
- [10줄 서평] 빌게이츠의 '빌게이츠, 기후재앙을 피하는 법'
- [10줄 서평] 김강원의 '카카오와 네이버는 어떻게 은행이 되었나'
- [10줄 서평] 정세랑의 '시선으로부터,'
- [10줄 서평] 알터 에고 이펙트 "부캐 열풍, 내 안의 영웅을 끌어낸다"
- [10줄 서평] 니와 우이치로의 죽을 때까지 책읽기
- [10줄 서평] 최은수의 더 위험한 미국이 온다
- [10줄 서평] 미치오 카쿠의 초공간
- [10줄 서평] 윌리엄 퀸·존 터너의 버블:부의 대전환
- [10줄서평] 정연태의 ‘식민지 민족차별의 일상사’
- [10줄 서평] 조산구의 공유경제2.0
- [10줄 서평] 최원석의 ‘테슬라 쇼크’
- [10줄서평] 달러구트 꿈 백화점
- [10줄 서평]오노레 드 발자크의 '공무원 생리학'
- [10줄 서평] 니시노 세이지의 ‘스탠퍼드식 최고의 수면법’
- [10줄 서평] 린더 카니의 팀 쿡(Tim Cook)
- [10줄 서평]라나 포루하의 '돈비이블(Don’t be evil)'
- [10줄 서평]백재현의 '1일 1페이지 그날 세계사 365'
- [10줄 서평] 레베카 패닌의 중국이 세계를 지배하는 날