
카카오 테크 캠퍼스에서 수행하고 있는 과제물을 구현했다. 기존에 구현했던, 상품 CRUD를 바탕으로 회원 가입 및 로그인 기능을 구현하여 위시 리스트를 등록할 수 있도록 구현하였다. 로그인을 성공였을 땐, 토큰을 발급받게 된다. 그리고 해당 토큰을 헤더에 넣어 상품 등록 요청을 보내면 상품을 등록할 수있다. 그리고 GET요청을 보내어 등록함 상품 목록을 확인할 수 있다.

이번에 가져온 논문은 diffusio model을 이용한 tabular data(표 데이터) 대상 imputation 논문이다. 사실 categorical data를 대상으로 다룬 imputation 논문을 찾고 싶었는데, MICE와 같이 프레임워크로 나온 논문들을 제외하고 나면, 최신 논문이 얼마 나오지 않아 조사하기 힘들었다. 그래서 categorical data 대상 imputation 논문을 리뷰하기보단, categorical과 numerical data가 섞인 데이터를 대상으로 imputation 하는 논문을 찾아보았다. 오늘 소개할 diffusion models for missing value imputation in tabular data가 다루는 데이터도 mix data이다. ! 이번 논문..
diffusion models for missing value imputation in tabular data 논문 읽고 요약하기. https://illjuustory.tistory.com/210 [논문 리뷰] Diffusion models for missing value imputation in tabular data 이번에 가져온 논문은 diffusio model을 이용한 tabular data(표 데이터) 대상 imputation 논문이다. 사실 categorical data를 대상으로 다룬 imputation 논문을 찾고 싶었는데, MICE와 같이 프레임워크로 나온 논문 illjuustory.tistory.com

시계열 데이터를 imputation 해야 할 때, autoregressive model은 좋은 선택지였다. 그러나 최근 score-based diffusion model이 다양한 도메인에서 autoregressive model을 포함한 다른 모델들보다 더 좋은 성능을 보이고 있으며, 시계열 데이터 분야에서도 좋은 성능을 낼 것으로 기대되고 있다. 이 논문에서는 관측값을 기반으로 하는 score-based diffusion model을 활용하여 새로운 시계열 데이터 imputation 방법인 Conditional Score-based Diffusion model for Imputation (CSDI)를 제시하고 있다. 기존 score-based approaches와는 다르게, imputation 기능만을..
https://illjuustory.tistory.com/208 [논문 리뷰]CSDI: Conditional Score-based Diffusion Models for Probabilistic Time Series Imputation 시계열 데이터를 imputation 해야 할 때, autoregressive model은 좋은 선택지였다. 그러나 최근 score-based diffusion model이 다양한 도메인에서 autoregressive model을 포함한 다른 모델들보다 더 좋은 성능을 보이 illjuustory.tistory.com 드디어 논문 리뷰를 다 했다! 조금 더 보강한 뒤, 올리면 될 것 같다. 그런데 코드도 좀 더 보고싶고, 이걸 활용한 결과고 내보고 싶은데, 인턴 업무 진도 때문..
CSDI 논문이 꽤 길어서 시간 안에 다 못읽었다. score-based diffusion 모델에 대해 공부한 뒤, 읽어야해서 한 주더 시간이 필요할 것 같다. https://illjuustory.tistory.com/208
오늘 목표 : CSDI: Conditional Score-based Diffusion Models for Probabilistic Time Series Imputation 논문 리뷰 시작 - 요약과 배경까지 읽어보기 imputation 관련 논문을 찾던 중, 발견한 논문이다. 시계열 데이터 뿐만 아니라 일반적인 정형 데이터에 대해서도 사용할 수 있다고 초록에 밝히고 있어, 리뷰를 시작했다. 근데 리뷰가 아무리 찾아도 안나온다. 수학적 수식이 많아 혼자 이해해야할 것 같은데, 시간이 좀 걸릴 것 같다.

GAIN 논문을 들어가기 전, GAN에 대한 이해가 필요하여 간략해 GAN을 소개하겠다. 빠르게 정리해 보는 GAN Generative Adversarial Networks로 이름에서 알 수 있듯이 생성형 모델의 한 종류이다. "적대적 신경망"이라고도 불리는 이 모델은 서로 다른 두 개의 네트워크를 적대적(adversarial)으로 학습시키며 실제 데이터와 거의 유사한 데이터를 만들어 낸다. ( 생성된 데이터는 라벨 없음. 따라서 비지도 학습 ) GAN은 데이터의 확률 분포를 학습하여 실제 데이터와 유사한 가짜 데이터를 생성하는 Generator와 완성된 데이터가 원본 데이턴 지 생성된 데이턴지 판별하는 Discriminator로 구성되어 있다. 이 둘이 적대적 관계가 되어 G는 D를 속일만한, 원본 데..
GAIN: Missing Data Imputation using Generative Adversarial Nets 논문 리뷰 포스팅 완료 https://illjuustory.tistory.com/203

imputatioin으로 꽤 유명한 논문 인 것 같아, GAIN: Missing Data Imputation using Generative Adversarial Nets 선택했다. 2회차에 걸쳐 논문을 리뷰하기로 계획했으며, 반 정도 정리하였다.