기계가 사람을 모방하는 시대를 넘어설까요? 가까운 미래에는 아예 봇이 사람을 대신하는 시대가 올 것입니다. 그 미래를 보여주기라도 하듯 2018년 구글은 듀플렉스(Duplex) 서비스를 통해 봇이 사람 대신 헤어숍이나 레스토랑에 전화를 걸어 복잡한 대화를 이해하고 예약을 마무리하는 것을 시연했습니다. 이건 단편적인 기술만으로 상대방이 사람인지 기계인지를 판별하는 것 자체가 불가능해질 것을 의미합니다. 네이버 클로바는 NES라는 음성 합성 기술을 최근 발표했는데요. 이는 40분 정도의 실제 사람 음성을 녹음하면, 그 사람의 음성에 가까운 합성음을 손쉽게 제작할 수 있는 기술입니다. 유명 연예인들의 음성으로 보이스 챗봇을 만드는 것도 손쉽게 가능하겠죠? 최근에는 고객서비스센터의 전화상담 서비스도 봇이 대체하..
엣지 케이스 엣지 케이스란 알고리즘이 처리하는 데이터의 값이 알고리즘의 특성에 따른 일정한 범위를 넘을 경우에 발생하는 문제를 가리킨다. 예를 들면 fixnum이라는 변수의 값이 -128 ~ 127의 범위를 넘는 순간 문제가 발생하는 경우가 있을 수 있다. 어떤 분모가 0이 되는 상황처럼 데이터의 특정값에 대해 문제가 발생하는 경우도 마찬가지다. 엣지 케이스는 알고리즘의 특성에 따라 개발자가 면밀히 검토하여 예상할 수 있는 문제다. 이런 문제는 디버그가 쉽기도 하고 테스트를 통해 미리 방지하기도 쉽다. 비슷한 상황을 가리키는 용어로 경계 케이스(boundary case)가 있다. 코너 케이스 코너 케이스는 여러 가지 변수와 환경의 복합적인 상호작용으로 발생하는 문제다. 예를 들어 fixnum이라는 변수의..
하이퍼클로바의 학습 데이터 이렇게 큰 언어 모델은 역시 학습 데이터가 중요합니다. 네이버는 꽤 오랜 기간 다양한 IT 서비스를 운영해왔기에 한국어 데이터를 가장 많이 보유하고 있는 회사 중 하나라고 해도 과언이 아닐 것 입니다. 어떤 종류의 데이터가 이용되었는지 한번 살펴볼까요. 네이버 블로그 네이버 카페 커뮤니티 글 네이버 뉴스 기사 본문 네이버 뉴스 댓글 네이버 지식IN Q&A 국립 국어원 모두의 말뭉치 일부분 위키피디아 (영어/일본어) 어떻게 보면 가용할 수 있는 텍스트 데이터를 다 끌어와 집어 넣었다고 볼 수 있겠는데요. 오늘까지 수 년간 데이터를 차곡차곡 모아온게 빛을 발하는 순간인 것 같습니다. 데이터는 법적으로 사용에 문제가 없는 것들로만 추렸고, 혹시라도 등장하는 개인 식별 정도(PII)는..
코테는 대체로 문자열 위주로 나오고 기초 배경지식 + 구현력을 평가 하기위한 문제들이 주로 나옴. 그래서 코테만 준비할거면 프로그래머스랑 leetcode에서 문제 많이 풀어보는게 좋음. 물론 백준이랑 코드포스해도 상관은 없는데 이 두 개는 알고리즘 대회 준비에 더 적합해서 코테에서 점수 뽑으려면 좀 오래해야함. 그러니까 단기간에 효과 내기는 힘든데 몇달간 지속적으로 하면 코테는 갑자기 좆밥이 돼버리는 양상임. 삼성은 99% 완탐에 빡구현이니 백준, SWEA 에서 삼성 기출만 달달 풀면 됨. 다른건 하지마셈. 릿코드가 짱 dp만 다풀어도 ㅍㅌㅊ 코테 준비한다고 종만북 보고 백준에서 문제 존나 풀었는데 코테 개털리고 "아 씨발 공부 존나 했는데 제대로 못풀었네. 난 왤케 빡대가리지. 컴퓨터랑 안맞나.." 이..
인간이 아닌 기계가 데이터를 분석하고 결정까지 내린다고 했을 때 가장 먼저 생각나는 문제점은 ‘윤리성’이다. 기계의 결정이 윤리적으로 그릇된 것일 때가 있다는 건 이미 실제 실험과 프로젝트를 통해 입증되기도 했었다. 그래서 인공지능의 성능과 장점에만 집중하던 기업들은 어느 순간부터 인공지능의 윤리성에도 똑같이 관심을 갖기 시작했다. “인공지능은 강력한 신기술로 장점들만 열거해고 긴 목록이 만들어집니다. 하지만 이 장점들을 빠짐없이 누리기 위해서는 신뢰의 시스템을 먼저 구축할 필요가 있습니다. 인공지능이라는 기술 자체의 신뢰도도 높이고, 인공지능을 개발하는 사람이나 업체의 신뢰도도 높아져야 합니다. 인공지능의 결정을 설명할 수 있어야 하고, 인공지능이 데이터를 어떻게 처리하는지도 투명하게 공개해야 하며, ..
- Total
- Today
- Yesterday
- 2과목 소프트웨어 개발
- 대혐오시대
- 자연어처리 #TIL
- 데이터분석실무 #포스코빅데이터아카데미
- 뱅샐
- 주가반영
- 신은영
- 김정주이사
- sap코리아
- IT주식
- 크래프톤
- 20대대통령
- 빅데이터분석 #데이터분석실무 #포스코빅데이터아카데미
- IT뉴스브리핑
- 신은영대표
- 극단적선택
- 식별자오류
- 신입개발자일기
- CBDC
- 빅데이터 #데이터분석
- 유엔여성기구성평등센터
- 개발자일기
- 종만북
- 인공지능투명성
- 여성대표
- 주가부양책
- 신입일기
- 인공지능윤리성
- 테크스펙
- 포스코 #데이터사이언스 #데이터분석
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |