goosegoose.DRAM
article thumbnail
[Module 1. AI윤리] Part 3. 세계적인 데이터 과학자가 되는 법

1. Becoming a world - class data scientist 세계적 데이터 과학자들의 공통점 -> 데이터에 대한 호기심 호기심을 통해 이종데이터를 결합하는 능력 필요. ex) 서울시 야간버스 노선 개선 아직 만들어지지 않은 노선에서 몇 명이 타고 내릴 지 수요 예측하기 어려움 서울시 -> 통신사와 협업 통화 지역을 통해 유동인구를 파악할 수 있었음 ex) UN협업 개발도상국 물가 예측 프로그램 ex) 가짜 뉴스 탐지 전체적으로 네트워크에서 퍼지는 모양을 통해 가짜뉴스 탐지 가능 가짜 -> 점조직 형태의 산발적 네트워크 연결 구조, 짧은 주기성을 가지는 시간 패턴, 회피성 언어, 부정적 언어 사용(ex: 확실하진 않지만.. 등등) 진짜 -> 서로 연결된 상태로 퍼짐 위성영상처리기술 과거 :..

article thumbnail
[Module 1. AI윤리] Part 2. AI Ethics

인공지능 알고리즘과 윤리 이슈 1. AI and creativity (AI가 인간의 고유 영역인 창작을 할 수 있을까?) 위 사진은 구글의 magenta 프로젝트, 컴퓨터 비전 알고리즘의 딥 레이어 속 모습이다. 예전의 인공지능 예술은 위 사진 같은 느낌이지만, GAN(적대적 생성 신경망) 모델 출범 이후 다양한 분야, 특히 음악에서는 단순한 모방과 변형을 넘어 새로운 선율과 음색을 만들 수 있게 되었다. (AI 이야무스가 교향곡 제작.) 자연어 처리의 혁신(NLP분야): 대형 플랫폼마다 초거대 언어 모델 개발. (Open AI의 GPT-3, 딥마인드의 고퍼, MS의 Megatron-Turing) 이러한 초거대 언어 모델들은 문맥을 이해하고 방대한 지식을 쌓아 질의에 응답할 수 있으며 챗봇 형태로 일상적..

article thumbnail
[Module 1. AI윤리] Part 1. 데이터 분석과 AI학습에서 유의할 점

1. 데이터 해석(데이터를 잘 해석하고 있는가?) "1인당 연간 다크 초콜릿을 5kg 이상 섭취하는 나라 국민들은 인지 기능이 향상되어 노벨상 수상자가 많이 나온다"라는 논문이 있다. 이는 상관관계와 인과간계에 대한 해석이 잘못된 것. (이 논문의 경우 이는 상관관계이지 반드시 인과관계를 의미하진 않음.) 2. 데이터 전처리와 분석 방법은 적절한가? (에러바가 없는 도표) - Error bar.(붉은색 바) 추가하기. -> 시각적인 가이드 제공 - 적절한 통계 테스트 찾기. -> 실제로 데이터를 해석할 때 사용 - 아웃라이어 제거하기. -> 너무 크거나 같은 극단값 제거 (데이터 전처리) - 데이터 표준화하기. -> 데이터 값 정규화 - EDA(exploratory data analysis) 충분한 시간..