12월 8일 모두의연구소에서 주최한 모두콘에 참여했다.
내용이 많아 1, 2부로 나눠서 글을 작성했다.
인트로
모두의 연구소는 오름클래스, 랩, 풀잎스쿨, 페이퍼샵 등
연구나 스터디를 원하는 사람들이 함께 할 수 있도록 여러가지를 지원해주는 곳이다.
그 중에서 '랩'은 랩짱이 팀원들을 모아서 그룹으로 운영되는데,
혹시나 관심분야의 모임이 올라올까 유심히 보고있기도 하다.
그러던 중 2023 모두콘 소식을 듣게되었다.
행사는 5가지 세션(AI Insight, AI+X, AI Reserch, MODULABS, Startup Woman Fighter)으로 구성되어 있었다.
각 세션별로 동시에 진행되기 때문에 관심있는 주제를 골라서 들을 수 있었다.
공개된 세션의 퀄리티를 보니 무조건 가야겠다고 생각했다.
행사는 이화여대에서 진행되었다.
생각보다 행사장이 크고 사람도 많아서 깜짝 놀랐다.
1. 글로벌 AI 전쟁: 한상기가 묻고 하정우가 답하다.
첫번째 내용은 키노트로, youtube로도 공개가 되어있어서 첨부한다.
ChatGPT가 촉발한 초거대 생성 AI의 글로벌 전쟁이 벌어지고 있는 현재
우리는 현재 상황을 공유하고 어떤 대응 전략이 필요한지 함께 논의합니다.
1-1. 네이버의 하정우님 발표
먼저 gpt에 대한 이야기를 하였다.
- AI 전문가들이 모여서 글로벌 AI 안전을 위한 규제를 논의하는 행사인, AI Safety Summit 2023에 참여했던 이야기를 들려주었다.
- 핵심 내용은, AI가 가져올 성장과 혁신에는 동의하지만 안전에 위해를 가할 수 있는 부분도 있기 때문에 밸런스가 필요하다는 내용이었다.
- 새로운 기술의 악용을 방지하기 위해 충분히 필요한 행사이지만, 먼저 규제를 선점하여 AI의 패권을 잡으려는 미국과 다른나라들의 눈치싸움도 있었다는 의견도 있었다.
1-2. 하정우님과 한상기님의 질의응답
Chat-gpt를 이용한 언어모델 플랫폼에 관한 이야기를 더 나눴다.
- Q. 핸드폰이라는 강력한 수단이 생기고나서 앱 플랫폼이라는 시장이 형성되었듯, Chat-gpt라는 수단이 사용될 새로운 플랫폼이 등장할 것 같다. 네이버는 이에 대한 준비를 하고있는가?
- A. 그렇다. 네이버도 비슷한 형태의 플랫폼을 만들 예정이다.
- Q. 앱 플랫폼도 그렇게 시작되었는데, 결국 애플의 앱스토어, 구글의 플레이스토어가 독점했다. 글로벌 기업과 경쟁이 가능한가?
- A. AI는 앱서비스와 비교했을 때 문화에 더 큰 영향을 받기 때문에 글로벌 기업의 독점이 어려울 것이다.
느낀점: 구글, 마이크로소프트 등 글로벌 빅테크 기업과 비교하면 네이버는 중소기업인데, 나름 경쟁하려고 한다는 말이 인상깊었다.
2. 카카오브레인의 이미지 생성 모델인 Karlo 개발기 - 김세훈
- T2I(Text to Image) 모델을 만들려면?
- Text가 있는 경우
- Text가 아닌 Image가 주어지는 경우(이미지 합성)
- 입력 text → text feature 추출(여기가 중요) → 이 feature로 저화질 이미지 생성 → 고화질로 개선
- Super resolution 성능을 달성하기 위해 diffusion loss + gen loss 아이디어를 결합함
- Cascade 모델의 문제( != end-to-end model)
- 약한 연결고리에서 발생하는 문제를 어떻게 해결 할 것인가 → Augmentation으로 해결
- 아이디어로는 성능개선이 되었는데, 학습 데이터 양이 많지 않아서 발생하는 성능차이도 있기 때문에 이를 반영하여 개선모델을 24년에 선보일 예정
- 복잡성이 높은 이미지를 생성하려면?
- T2I는 둘의 상관관계가 측정 혹은 확인되어야 함
- Dall-e 3에서 caption에 대한 결과를 공개함(논문에 있음)
- 실제 결과로도 caption을 잘 달아야 이미지도 고품질로 나옴
3. 내일을 바꾸는 기술의 힘, 그 시작점에 서다 - 한서우
(남방큰돌고래 보호? 연구)
- 드론으로 선박과 돌고래와의 거리를 파악하는 솔루션 개발
- 왜? → 돌고래를 가까이에서 보기 위해 선박이 접근하여 돌고래들이 다치거나 죽는 사고가 많이 발생함
- 알고리즘을 구현할때의 어려움
- 이미지를 사용하는데, 햇빛이 바다에 반사되는 현상때문에 파도와 돌고래를 구분하기 어려움
- 연속된 프레임 몇개를 합치고 밝은 값을 표현하는 요소를 없애면 돌고래만 남음(알고리즘 개발함)
- 큰 해상도 이미지에서 검출하고자 하는 영역이 작은 문제
- SAHI 라이브러리 사용
- Byte Track? 잠깐 사라진 객체를 이후에 나타났을때 다시 검출할 수 있도록 함
- Custom dataset 어느 정도 튀어나온 돌고래만 검출할건지? 등을 고려해서 dataset을 구성함
- 이미지를 사용하는데, 햇빛이 바다에 반사되는 현상때문에 파도와 돌고래를 구분하기 어려움
- Object-detection의 성능은 80정도
- 여기에 anomaly detection 추가함
- 바다 아래 암석도 돌고래로 인식하는 경우가 있기 때문
- 거리를 정확하게 측정하기 위해 드론의 특성 고려
- 각도, 이미지 정사영, focal length 등 일반화하는 알고리즘 개발
- 조종기 log와 드론 데이터 log의 sync를 맞춰야 함
- 드론은 날리는 시작 위치가 0이기 때문에 어디서 날렸는지도 중요함
- BE는 FestAPI 사용
느낀점: 재미있는 연구였다. 해양에서 거리를 측정하는 다른 방법은 없는지 궁금했다.
4. Few-shot generalist for dense visual prediction - 김동균
- 자리가 없어서 뒤에 서서들었는데, 거의 못들었다..
5. 제로 베이스에서 구축하는 추천 시스템(Feat. 교육 플랫폼) - 이수진
- 웅진씽크빅의 IT 교육 플랫폼인 유데미의 추천시스템 구축 내용이었다.
- 당시 상황
- 데이터는? 없음
- 8개원만에 만들어야 하는 상황
- 유데미 설립(2010), 큐레이션 서비스(2021년에 오픈)
- 개발 과정
- 먼저 유관부서와 미팅을 통해 목표, 방향성, 현황 파악
- 개인화 추천 + 사용지들이 지속적으로 활동할 수 있도록 하는것
- 데이터 현황 정리 및 데이터 로깅 설립 → 데이터 수집 및 표준화 → 데이터 점검 및 가공 → 개인화 연구 및 개발
- 가장 중요한건 데이터 신뢰도, 일관성, 호환성(사용자들이 어떤 학습활동을 하고있는가)
- 사용자 학습경험 데이터를 표준화, 수치화 할 수 있는 eXperience API가 있음(데이터 수집의 수단)
- 추가로 학습활동을 어떻게 정의 할 것인가
- 사용자 행동 시나리오를 설계해보고, 그 과정에서 어떤 데이터가 나올 수 있는지, 어떻게 활용할 수 있을지가 구체화 됨
- 수많은 행동 시나리오를 정리하면 ‘데이터 정의서, 이벤트 설계서’ 등의 규격이 나옴
- 서비스 출시까지 개발자, 관리자, 기획자 관점에서 계속 검증
- 추천모델 연구
- 여러 알고리즘들을 테스트 해봄
- 결과는 다 좋음, 이유는 데이터 퀄리티가 좋으면 결과는 잘나옴(앞서 계속된 검증으로 데이터 퀄리티는 확인)
- 알고리즘 고도화 보다는 서비스관점에서 연구 진행함
- Multi-head self0attention + shuffling(Spotify 기술블로그에서 아이디어)
- 클릭률 향상을 기준으로 연구, 개발을 함(따라서 일부 사용자 히스토리, 메타 데이터가 있어야 함)
- 사용자는 5개로 그룹핑 됨(각각 모델이 다른가? → 그렇다)
- Offline, online에 따라 평가 matrix가 다름
- 종합적인 지표를 이용하여 평가
- 향후 계획
- 대시보드 구축 → 안정화&모니터링 → insight 도출 → 디지털 트랜스포메이션 전략 구현 → CRM
- Q&A
- 알고리즘에서 사용자 행동데이터가 어느정도 사용되는지?
- 모델 성능 관점에서 데이터 정의는 아니고 서비스, insight를 얻을 수 있는 관점에서 데이터 정의함
- 추천시스템 구축 → 모델은 작은 부분, 배포 전에는 기획이 중요, 배포 후에는 모니터링이 중요(Python ml-flow 라이브러리)
- 추천모델 연구
느낀점: 현업에서 추천시스템이 사용되는 전 과정을 설명해주었다. 정말 유익한 시간이었다. Sota 모델보다 중요한건 '서비스 관점에서 문제 정의'로 요약할 수 있다. 정말 공감한다.
점심으로 샌드위치와 음료수도 제공되었다.
맛있게 먹고 2부로~!
'활동' 카테고리의 다른 글
Build with AI United 참여 후기(Gemini 활용법) (0) | 2024.05.04 |
---|---|
Wanted X 도전기 (0) | 2024.04.22 |
테크포임팩트 커넥트데이 (4) | 2023.12.28 |
MODUCON 2023, 모두콘 - 2부 (1) | 2023.12.27 |
[가짜연구소] 7th PseudoCon, 수도콘 (1) | 2023.12.06 |
댓글