본문 바로가기
상식과 지식 사이

EBS 위대한 수업3 (모두를 위한 수학) 5강 스마트폰이 내 얼굴을 알아보는 법

by 상팔자 2023. 11. 1.
반응형

(2023.10.31 방송)

 

 

EBS 위대한 수업3 (모두를 위한 수학) 5 스마트폰이 내 얼굴을 알아보는 법

위대한 여든아홉 번째 강연 ' 모두를 위한 수학 '(시즌3 여덟 번째)

 

 

 

 

테렌스 타오 UCLA 수학과 교수

미국 대통령 과학기술 자문위원

IQ 230

최연소> 10살 국제 수학 올림피아드 동메달 수상

최연소> 11살 국제 수학 올림피아드 은메달 수상

최연소> 12살 국제 수학 올림피아드 금메달 최연소 수상

필즈상 (2006)

라마누잔상 (2006)

리만상 (2019)

 

 

 

 

 

 

 

5  스마트폰이 내 얼굴을 알아보는 법

 

 

 

 

< '알파고'에 숨겨진 수학 >

 

2016년, 세계 바둑 챔피언 이세돌을 꺾은 '알파고'에는

첨단 수학 기술이 쓰였다

 

인공지능 이야기에 앞서 간단한 수학 퀴즈를 살펴보겠다

수열의 다음 숫자를 알아맞히는 문제이다

예를 들어 6, 14, 36, 98이라는 수열이 있을 때

다음에 올 숫자는 뭘까?

 

이런 퀴즈는 주로 어린이용으로 쓰이고

IQ 테스트에도 가끔 나온다

이런 문제는 답이 많은 '불량 조건 문제'이다

수에는 다양한 규칙이 있으니까 다음 숫자는 뭐든지 될 수 있다

어떤 수열 다음에 올 유일무이한 답은 없다

 

하지만 답이 여럿인 불량 조건 문제에도 가장 자연스러운 답은 있다

수열 끝에 들어갈 만한 수 중 이전 수들의 규칙에 가장 잘 들어맞는 게 존재한다

 

 

수열 끝에 가장 어울리는 수는 어떻게 찾을 수 있을까?

 

그 방법 중 하나는 '회귀'라고 하는 오래된 수학 기법이다

※ 회귀(Regression): 변수 간의 관계를 분석하는 통계학적 방법

회귀란 주어진 데이터를 이용하는 것이다

입력값과 출력값이라는 한 쌍의 데이터로 정리하는 것이다

 

이제 다섯 번째 수를 찾아야 한다

입력값이 5일 때 출력값은 뭘까?

우린 수학을 통해 문제의 형태를 바꿀 수 있다

 

한 쌍의 숫자는 좌표 평면의 점과 같다

학습용 데이터를 '산점도'라는 그래프로 정리한다

수열의 4개 항은 4개의 좌표로 바꿀 수 있다

(1, 6)은 가로 거리가 1이고 수직 거리가 6인 점이다

4개의 점을 그래프요 표시하고

주어진 데이터에 맞춰 '함수 그래프'를 그린다

점 4개를 잇는 곡선은 수없이 많지만

가장 보기 좋은 곡선이 있을 것이다

 

보기 좋은 곡선을 찾으면 문제의 답이 나온다

원하는 입력값인 '5'를 넣기만 하면 된다

그리고 이 보기 좋은 곡선에서 가로축 값이 5인 점을 찾는 것이다

 

이 수열에 어떤 규칙이 있고 왜 답이 276인지는

직접 풀어 보기 바란다 (힌트> 6 = 1 + 2 + 3)

 

이런 기법을 '회귀'라고 한다

주어진 데이터에 딱 맞거나 거의 들어맞는 곡선 중

최대한 보기 좋은 걸 찾고 그 곡선으로 다음 데이터를 예측하는 것이다

 

가장 유명하면서도 간단한 회귀 기법은 '선형 회귀'이다

데이터에 맞는 직선 그래프를 찾는 것이다

직선이야말로 가장 단순하고 보기 좋은 선이기 때문이다

데이터가 선형적이라면 데이터는 직선에 가깝게 흩어져 있을 것이다

 

잘하면 아주 정확한 그래프를 찾을 수 있다

그러면 학습용 데이터에 없는 다른 입력값도 측정할 수 있다

 

하지만 데이터가 선형적이지 않을 땐 선형 회귀 분석이 잘 안 통한다

그래서 비직선적인 회귀 분석 기법('비선형 회귀')도 있다

데이터가 직선이 아닌 직선 모양일 때 쓰는 것이다

 

데이터에 최대한 들어맞는 곡선을 찾는 기법이 있긴 하다

곡선을 복잡하게 그릴수록 데이터에 맞추긴 쉽다

하지만 데이터에 곡선을 너무 맞추면 '과적합'이란 문제가 생긴다

그러면 오히려 다른 데이터에서 예측이 부정확하다

사실 이게 통계학이란 학문의 절반이다

통계학은 온종일 정확한 답을 찾기 위해 

과적합도 피하고 회귀 분석을 얼마나 할지 고민하는 학문이다

 

앞선 예시에서는 입력값과 출력값이 각각 하나였다

하지만 현실에선 보통 입력값이 여러 개다

실제 문제의 입력값은 대부분 다차원적이다

건강 분야의 경우 키와 몸무게 둘 다 중요하다

따라서 입력값은 키와 몸무게가 된다

출력값은 대충 암 발병 확률이라고 치자

키, 몸무게, 나이, 성별 등 다양한 입력값이 존재한다

따라서 현실에선 다차원 데이터를 자주 다루게 된다

데이터도 단순한 곡선 대신 곡면이나 더 고차원적인 

형태에 맞춰야 한다

 

다행히 저차원 회귀 분석의 수학 기법은

보통 고차원 회귀 분석에도 적용된다

물론 데이터를 고차원에서 시각화하는 건 어렵다

 

하지만 수학적 원리는 그대로 통한다

 

그래서 다차원 데이터도 회구 분석이 가능하다

통계학계에 회귀 분석이 처음 등장했을 땐

 

하지만 이젠 기계 학습 기술 덕분에

입력값이 수백만 개인 수백만 차원의 회귀 분석도 가능하다

 

 

☆ 기계 학습 ☆ 

요즘 기계 학습은 그 자체로 하나의 학문이다

데이터를 통해 기계를 학습시키는 방법을 연구하는 것이다

 

그러면 기계는 보상을 최대화하기 위해

점진적으로 전략을 바꾸며 학습한다

 

예를 들어 펭귄 사진(입력값)과 '펭귄(출력값)'이란 단어가 있다

일고리즘에 이런 이미지나 단어를 수없이 주고 학습시켰다

펭귄, 오리 등 수많은 새를 가르쳤다

그다음 처음 보는 이미지를 주고 이게 펭귄인지, 오리인지 물어본다

이게 바로 아이들이 단어를 배우는 방법이다

 

기계가 이런 문제를 풀게 하는 건 학계의 오랜 과제였다

일명 '이미지 인식 문제'라고 한다

그런데 적절한 인공 신경망에 많은 양의 데이터 세트를 학습시키면

이미지 인식 성능도 좋아진다는 게 드러났다

 

요즘은 이런 이미지 인식 기능이 내장된 전자 기기가 많다

스마트폰에도 안면 인식 기능이 있어서

주인 얼굴을 인식해 주인만 잠금을 풀 수 있다

주인 얼굴이 남의 얼굴과 어떻게 다른지 학습하는 것이다

물론 그러려면 수많은 학습용 데이터가 필요하다

수많은 이미지와 이미지들의 이름이 필요하다

 

재밌게도 그런 학습용 데이터는 대부분 인간이 제공한다

웹사이트에 접속할 때마다 '캡챠'라는 퀴즈를 푼다

 

 

최근에 이미지 인식을 뒤집은 놀라운 기술이 나왔다

설명을 입력하면, 거기 맞는 이미지가 나오는 것이다

더욱 놀라운 건 학습용 데이터에 없던 설명을 넣을 수도 있다는 것이다

가령 '말을 타는 뽀로로'라고 입력하면 

학습한 데이터에 없더라도 그런 이미지를 만들어서 보여준다

 

수학은 이런 기술이 가능하단 걸 증명했다

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

위대한 수업 (ebs.co.kr)

 

위대한 수업 Great Minds

위대한 수업 그레이트 마인즈, 전세계 최고의 지성을 한 자리에!

home.ebs.co.kr

 

EBS 1TV 월~금 23:40 ~ 24:00 (본방)

EBS 1TV 토 24:45 ~ 26:15 (종합)  /  EBS 2TV 금 24:00 ~ 26:00 (종합)

 

 
 
 
 
 
 
 
 
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 
 
 

 

 

 

 

 

 

반응형

댓글