AI/DS기고

[2류 국가, 2류 인재] ④노동력의 역량과 지적 인프라의 역량이 낳는 시너지 효과

[2류 국가, 2류 인재] ④노동력의 역량과 지적 인프라의 역량이 낳는 시너지 효과

노동력의 역량은 교육 방식 개선으로 끌어올릴 수 있어
지적 인프라의 한계는 결국 영어권이 아닌 이상 한계가 있을 수밖에
남은 것은 부족한 인프라를 극복하고 고급 지식을 ‘응용’할 수 있는 학생의 역량

우리 SIAI에서 BSc Data Science로 교육 중인 학생 하나가 미국 대학들로 석·박 유학을 가고 싶다며 추천서를 써 주실 수 있냐고 찾아왔다. 그 시절 추천서 한 장 받기 쉽지 …

[2류 국가, 2류 인재] ③한국 사회에 유일하게 남은 선택지는 ‘대학 개혁’

[2류 국가, 2류 인재] ③한국 사회에 유일하게 남은 선택지는 ‘대학 개혁’

지적 역량, 지적 결과물의 효율성을 키우는 것만이 한국 사회의 유일한 탈출구
대학 교육 수준 높이도록 대부분의 수준 미달 대학들 퇴출시켜야
사회적 비용을 치르는 집단은 실력없는 교수들 일부에 불과

한국 사회가 지난 수십년간 막대한 노동력을 쏟아 넣어 자본금으로 바꾼 덕분에 지금의 번영을 구가할 수 있는 반면, 시대가 바뀌면서 노동력이 복지를 요구하는 와중에 정작 노동력의 고급화, 그 고급화를 지원해 줄 …

[2류 국가, 2류 인재] ②인적 자원, 지적 자원, 물적 자원, 3박자가 골고루 후진적인 나라

[2류 국가, 2류 인재] ②인적 자원, 지적 자원, 물적 자원, 3박자가 골고루 후진적인 나라

한국은 인적, 지적, 물적 자원 중 인적, 지적 자원에 심각하게 결핍된 나라
실패의 원인은 교육의 붕괴, 결과는 경제 성장 침체
역량 부족에 비해 인적 자원의 지나친 복지 요구도 문제의 원인 중 하나

간밤에 엑스포를 개최하겠다고 대통령이 프랑스 파리까지 날아갔다가 고배를 마신 소식이 전해졌다. 원래부터 안 될 일이었는데 보고가 잘못 올라가는 바람에 대통령이 힘을 썼다는 핑계에 불과한 논평도 봤고, …

[2류 국가, 2류 인재] ①영어권 코딩 부트캠프 인재가 한국 SKY보다 개발을 잘하는 이유

[2류 국가, 2류 인재] ①영어권 코딩 부트캠프 인재가 한국 SKY보다 개발을 잘하는 이유

한국 초명문대 컴공과 출신 개발자들이 만든 시스템보다
영어권 6개월 코딩 부트캠프 출신 인재들이 만든 시스템이 더 뛰어난 이유
한국은 인재 문제, 지식 기반 문제, 자본 문제를 총체적으로 갖춘 2류 국가이기 때문

박사 유학 중 가끔 들르던 한국어 권의 특정 노트북 브랜드 커뮤니티가 있었다. 영어권에서 더 활성화되어 있는 커뮤니티고, 보스턴에서는 가끔 오프라인 모임이 있으면 찾아가곤 했었기 때문에 한국에서도 비슷한 …

웹소설이 웹툰으로 바뀌는 과정과 데이터 사이언스

웹소설이 웹툰으로 바뀌는 과정과 데이터 사이언스

웹소설이 웹툰으로 바뀌는 구조는 ‘자본의 논리’만 작동하는 것 아냐
‘작가의 의지’가 반영되는 비중 높으면 외부 알려진 단순 시장 변수로는 예측 불가능
데이터 사이언스 모델링은 언제나 시장 상황에 대한 이해부터 시작해야

SIAI의 MBA AI/BigData 졸업 논문 쓰느라 고생 중인 학생 하나가 잡은 주제가 웹소설이 웹툰으로 바뀌는 조건이다. 일반적으로 생각하기에는 조회수가 많고, 웹소설 판매량이 많은 경우에 웹툰 스튜디오랑 추가로 계약해서 …

왜 온라인 학위 과정은 오프라인 학위 과정보다 수준이 떨어진다고 생각할까?

왜 온라인 학위 과정은 오프라인 학위 과정보다 수준이 떨어진다고 생각할까?

온라인 학위 저평가 원인은 대학들이 오프라인보다 입학 난이도 및 교육 난이도를 가볍게 운영하기 때문
장기간 온라인 교육에 대한 평가 절하 인식이 퍼져 있어 편견 확대되는 효과도
난이도 높이면 결국 학생들의 기초 실력과 열정에 따라 성취도 구분되는 효과 나와

지난 코로나19 기간을 겪으며 한국 사회에서도 온라인 교육 과정에 대한 편견이 많이 사라지는 했지만, 여전히 온라인 교육은 오프라인 교육보다 품질이 …

인공지능 석·박사 학위 과정은 실제로 임금 상승에 도움을 줄 수 있을까?

인공지능 석·박사 학위 과정은 실제로 임금 상승에 도움을 줄 수 있을까?

국내 대기업 급여 산정 방식은 학위를 연차로 전환 계산해 모델 의미 없어
해외 방식 급여 산정시 학위 별 더미 변수 설정, 급여 성장률과 결합으로 분석 가능
더미 변수 설정 없이 단순 ‘인공지능 계산’으로는 잘못된 결론 얻을 수 있어

보통은 새로운 모임에 가면 공부를 많이 하고 왔다는 사실을 숨기는데, 본의 아니게 전문성이 담긴 발언을 꺼낼 수밖에 없는 순간이 오고, …

홍대 앞 상권이 청년을 불러모았을까? 청년들이 상권을 만들었을까?

홍대 앞 상권이 청년을 불러모았을까? 청년들이 상권을 만들었을까?

상권과 특정 세대 소비자 집중도 관계 분석시 동시성의 오류 발생할 가능성 높아
도구 변수를 이용해 둘 간의 복합 상관관계를 단순 상관관계로 분리해야
실제 기업 사례에서도 잘못된 계산 후 잘못된 결론 얻는 경우 많아

데이터 사이언스 관련 프로젝트를 하다보면, 비일비재하게 발생하는 사안이 인과관계 오류다. 원인이라고 생각했던 변수가 사실은 결과였고, 반대로 결과라고 생각했던 변수가 원인인 경우들이 상당히 많다. 이런 오류를 …

SNS를 많이 쓰는 사람들의 연봉은 낮다는 속설은 사실일까?

SNS를 많이 쓰는 사람들의 연봉은 낮다는 속설은 사실일까?

1변수 분석은 큰 오류 낳을 수 있어, 항상 다양한 변수 간 복합 관계 이해해야
데이터 사이언스는 다양한 변수 간 복합 관계를 찾아내는 모델 연구 작업
1변수 집착은 과거 방식, 빅데이터 시대에 맞춰 사고 방식 개선해야

데이터 사이언스 교육을 하거나, 직원들이 잘못된 결론을 갖고 왔거나, 외부에 강의를 나갔을 때 항상 강조하는 부분이 ‘1변수 회귀분석(One-variable regression)’을 하지 말라는 것이다.

가장 간단한 …

‘예/아니오’ 잘 맞추는 모델이 무조건 좋은 모델일까?

‘예/아니오’ 잘 맞추는 모델이 무조건 좋은 모델일까?

고분산 데이터에는 0/1 맞추기 모델 무의미, 새로운 데이터에서 같은 정확도 내기 힘들어
해석 가능한 인공지능은 결국 기초 통계학 모델로 돌아가는 것
무조건 ‘인공지능’=’고급모델’=’정확한 모델’ 아냐, 잘못된 모델 쓸 경우 잘못된 해석 밖에 나오지 않아

5년 전의 일이다. 보스턴 지역의 주거지 관련 데이터를 이용해, 방 크기, 방 숫자 등의 정보를 이용해 집 값, 혹은 월세를 맞추는 단순한 ‘인공지능’ 학습자료가 …

비교우위론과 콥 더글라스 생산함수로 해석하는 미・중 갈등 ②

비교우위론과 콥 더글라스 생산함수로 해석하는 미・중 갈등 ②

비교우위론과 콥 더글라스 생산함수로 해석하는 미・중 갈등 ①에서 이어집니다.

이전 글에서는 헥셔-올린 정리와 콥 더글라스 생산함수, 그리고 회귀분석의 관계를 살펴봤다. 정리하면 헥셔-올린 정리는 국가 간 ‘요소집약도’의 차이에 따라 비교우위 및 무역이 발생하는 것이고, 이를 회귀분석으로 추정된 콥-더글라스 생산함수의 ‘탄력성’으로 뒷받침할 수 있다는 것이다.

이번 글에서는 미・중 갈등으로 양 국의 산업 구도가 바뀌는 최근 양상을 소개하고, 해당 논의를 …

비교우위론과 콥 더글라스 생산함수로 해석하는 미・중 갈등 ①

비교우위론과 콥 더글라스 생산함수로 해석하는 미・중 갈등 ①

최근 미・중 갈등이 심화되고 있다. 지난 2018년 시작된 트럼프 행정부의 대(對)중 무역 견제를 필두로 2021년 집권한 바이든 행정부에 들어서는 초당적 인프라법, 반도체 및 과학법 통과 등 제조업 중심의 내수 펀더멘탈 회복 및 중국 ‘옥죄기’를 목표로 파격적인 행보를 이어가고 있다. 또한 이 때문에 상호 의존하고 있는 글로벌 산업 구조 재편되는 분위기다.
예컨대 한 때 세계적으로 독보적이었던 미국 …

챗GPT, 언어 기반 노동시장엔 고급 인력만 남기고 다 내보내게 될 것

챗GPT, 언어 기반 노동시장엔 고급 인력만 남기고 다 내보내게 될 것

지난 12일, 데이터 사이언스 경영학회 세미나에서 최근 이슈가 된 챗GPT가 기반하고 있는 대형언어모델(Large Language Model, LLM)의 방법론을 풀어내는 설명과 함께, 활용법이 노동 시장을 바꾸는 부분에 대한 예상을 정리했었다.
구글 검색을 해보니 챗GPT가 출시된 지난해 11월부터 올해 5월 초까지 무려 433,000개의 뉴스 기사가 ‘chatgpt’라는 검색어에 걸렸다. 뉴스 업계에서 광고 기사 1개 내는데 지불해야하는 비용을 감안하면 수십조원의 광고 …

SBS 데이터 저널리즘의 오해 – 최근 연구일수록 창의성이 줄어든다?

SBS 데이터 저널리즘의 오해 – 최근 연구일수록 창의성이 줄어든다?

얼마 전 제보를 하나 받았다. 지상파 방송국 중 하나인 SBS에서 어느 한 논문을 근거로 최근 들어 논문의 창의성이 줄고 있다는 주장을 내놨단다.
출처=트위터
기존 연구를 인용한 정도가 높으면 창의성이 낮은 논문이라는데, 그 기준에서 보면 1950년대부터 점점 창의성이 낮아지고 있다는 것이다.
공학 쪽에서는, 특히 요즘에는 AI 논문이라고 하면서 신경망(Neural Network) 모양만 살짝 바꾼 논문이 너무 많으니까 저 논리가 맞을 …

워드 클라우드 하나 넣고 ‘데이터 분석’ 타이틀 단 기사

워드 클라우드 하나 넣고 ‘데이터 분석’ 타이틀 단 기사

사진=https://www.hankyung.com/economy/article/202212224549i
필자가 운영하는 언론사 팀에서 위의 기사를 보내주면서 ‘데이터 분석’ 관점에서 어떻게 생각하냐고 묻더라.
가치가 없습니다.
라고 답변해 드렸다.
저런 워드 클라우드(Word Cloud)룰 만드는 작업은 뭐 그렇게 대단한 것도 아니고, 대단한 정보를 뽑아낼 수 있는 것도 아니다. 아주 예전에 필자가 강의할 때 수업 마지막 날쯤 해서 머리 식히라고 코드 몇 줄 쳐서 줬던 수준에 불과하다.
이걸 만든 사람은 웹사이트를 긁어서 …

(여러 전공에서) ‘수학’, ‘통계학’을 쏙쏙 뽑아 배우는 게 DS 공부법?

(여러 전공에서) ‘수학’, ‘통계학’을 쏙쏙 뽑아 배우는 게 DS 공부법?

사진=SIAI
다음은 필자가 올 초 어떤 학생으로부터 받은 메일이다. 그냥 조금 딱하다는 생각이 들었기에 공유한다.

안녕하세요. 저는 제가 고등학생이던 파비 블로그에 댓글에 열려있던 때부터 최소 일주일에 한 번씩 대표님의 블로그에 들어가 글을 보고 있는 20학번 대학생입니다. 대표님의 글을 고등학교의 다소 늦은 시기에 접한 탓에 경영학과로 대학에 입학했으나, 대학에 들어와 수학과와 통계학과를 복수전공하고 있습니다. 제가 재학 중인 학교는 …

한국 AI 경쟁력 100위권 밖…스타트업 실전형 인재양성 시급 – 너네 때문에 100위권 밖이란다!

한국 AI 경쟁력 100위권 밖…스타트업 실전형 인재양성 시급 – 너네 때문에 100위권 밖이란다!

기사 링크: “한국 AI 경쟁력 100위권 밖…스타트업 실전형 인재양성 시급” – 머니투데이 (mt.co.kr)
필자가 저 기사를 보면서 든 생각은
너네 때문에 100위권 밖이란다, 이 멍청이들아!
였다.
디지털 경쟁력 상위권인 우리나라가 주요 분야인 AI 등에서 100위권 내에 이름을 올리지 못하고 있는 건 왜일까? 이상하지 않은가?
그런데 개발자가 그렇게 귀하다고 그러고, 연봉이 그렇게 높다고 하는데, 왜 막상 필자가 뽑으려고 보는 ‘AI 전문 …

서울 소재 데이터 사이언스 대학원생이 받는 수업 과제의 현실

서울 소재 데이터 사이언스 대학원생이 받는 수업 과제의 현실

최근 국내 모 대학교의 데이터 사이언스 대학원에 다니다가 그만두고 SIAI의 MBA AI/BigData에 온 학생과 이런저런 이야기를 나눴다. 매번 수업을 따라오느라 힘들어했는데, 이제는 너무 자주 이야기한 내용이라 별로 흥미롭지도 않을 거란 생각이 들지만, 그래도 이런 메일을 받으니 서글펐다. 대체 우리나라의 교육은 어떻게 되려는 것일까?

필자는 오늘 회사 CTO님과 점심을 함께하던 중 회사의 직원을 채용해 교육하고 회사의 방침에 …

학업성취도 평가 반대자들에게 바치는 ‘인공지능’ 알고리즘

학업성취도 평가 반대자들에게 바치는 ‘인공지능’ 알고리즘

최근 신문 기사에서 학업성취도 평가를 치르자는 일부 교육감들과 일제고사에 반대하는 다른 지역 교육감들, 그리고 어떤 특정 그룹에 속한 교사들이 갑론을박을 벌이고 있다는 소식을 접했다. 일렬로 줄 세우기를 반대한다는 그 생각 자체에는 충분히 공감하지만, 자신의 현재 위치가 어디인지를 알려주는 시험의 가치를 저렇게 매도하면 제대로 된 인재를 길러낼 수 있는 교육 시스템을 어떻게 만들겠냐는 불만이 생기기도 했다.
그중에서도 …

우리나 언론의 ‘빅데이터’ 기사 수준

우리나 언론의 ‘빅데이터’ 기사 수준

최근 필자는 지인으로부터 “난데없이 빅데이터 분석하는 언론사를 만든 이유가 뭐냐”라는 질문을 받았다. 언젠가 언론사가 성장하면 밝힐 몇 가지 다른 사정들이 있기는 하지만, 필자는 지인에게 “너무 속이 터져서”라고 대답했다.
과연 우리나라에는 빅데이터라는 표현을 제대로 이해하고, 거기에 맞춰 ‘분석’을 할 수 있는 인력이 몇 명이나 될까? 개발자가 중심이 되어 데이터가 엄청나게 많이 쌓이는 상황을 빅데이터라고 표현하고, 수식어 붙이기를 …