goosegoose.DRAM
article thumbnail
[논문 리뷰] Diffusion models for missing value imputation in tabular data
논문 리뷰 2024. 2. 13. 11:00

이번에 가져온 논문은 diffusio model을 이용한 tabular data(표 데이터) 대상 imputation 논문이다. 사실 categorical data를 대상으로 다룬 imputation 논문을 찾고 싶었는데, MICE와 같이 프레임워크로 나온 논문들을 제외하고 나면, 최신 논문이 얼마 나오지 않아 조사하기 힘들었다. 그래서 categorical data 대상 imputation 논문을 리뷰하기보단, categorical과 numerical data가 섞인 데이터를 대상으로 imputation 하는 논문을 찾아보았다. 오늘 소개할 diffusion models for missing value imputation in tabular data가 다루는 데이터도 mix data이다. ! 이번 논문..

2024 동계 모각코 6회차 결과
2024 동계 모각코 2024. 2. 10. 18:10

diffusion models for missing value imputation in tabular data 논문 읽고 요약하기. https://illjuustory.tistory.com/210 [논문 리뷰] Diffusion models for missing value imputation in tabular data 이번에 가져온 논문은 diffusio model을 이용한 tabular data(표 데이터) 대상 imputation 논문이다. 사실 categorical data를 대상으로 다룬 imputation 논문을 찾고 싶었는데, MICE와 같이 프레임워크로 나온 논문 illjuustory.tistory.com

article thumbnail
[논문 리뷰] CSDI: Conditional Score-based Diffusion Models for Probabilistic Time Series Imputation
논문 리뷰 2024. 2. 6. 19:38

시계열 데이터를 imputation 해야 할 때, autoregressive model은 좋은 선택지였다. 그러나 최근 score-based diffusion model이 다양한 도메인에서 autoregressive model을 포함한 다른 모델들보다 더 좋은 성능을 보이고 있으며, 시계열 데이터 분야에서도 좋은 성능을 낼 것으로 기대되고 있다. 이 논문에서는 관측값을 기반으로 하는 score-based diffusion model을 활용하여 새로운 시계열 데이터 imputation 방법인 Conditional Score-based Diffusion model for Imputation (CSDI)를 제시하고 있다. 기존 score-based approaches와는 다르게, imputation 기능만을..

2024 동계 모각코 5회차 결과
2024 동계 모각코 2024. 2. 3. 10:51

https://illjuustory.tistory.com/208 [논문 리뷰]CSDI: Conditional Score-based Diffusion Models for Probabilistic Time Series Imputation 시계열 데이터를 imputation 해야 할 때, autoregressive model은 좋은 선택지였다. 그러나 최근 score-based diffusion model이 다양한 도메인에서 autoregressive model을 포함한 다른 모델들보다 더 좋은 성능을 보이 illjuustory.tistory.com 드디어 논문 리뷰를 다 했다! 조금 더 보강한 뒤, 올리면 될 것 같다. 그런데 코드도 좀 더 보고싶고, 이걸 활용한 결과고 내보고 싶은데, 인턴 업무 진도 때문..

2024 동계 모각코 4회차 결과
2024 동계 모각코 2024. 1. 25. 21:54

CSDI 논문이 꽤 길어서 시간 안에 다 못읽었다. score-based diffusion 모델에 대해 공부한 뒤, 읽어야해서 한 주더 시간이 필요할 것 같다. https://illjuustory.tistory.com/208

2024 동계 모각코 3회차 결과
2024 동계 모각코 2024. 1. 18. 23:05

오늘 목표 : CSDI: Conditional Score-based Diffusion Models for Probabilistic Time Series Imputation 논문 리뷰 시작 - 요약과 배경까지 읽어보기 imputation 관련 논문을 찾던 중, 발견한 논문이다. 시계열 데이터 뿐만 아니라 일반적인 정형 데이터에 대해서도 사용할 수 있다고 초록에 밝히고 있어, 리뷰를 시작했다. 근데 리뷰가 아무리 찾아도 안나온다. 수학적 수식이 많아 혼자 이해해야할 것 같은데, 시간이 좀 걸릴 것 같다.

article thumbnail
[논문 리뷰]GAIN: Missing Data Imputation using Generative Adversarial Nets
논문 리뷰 2024. 1. 11. 23:43

GAIN 논문을 들어가기 전, GAN에 대한 이해가 필요하여 간략해 GAN을 소개하겠다. 빠르게 정리해 보는 GAN Generative Adversarial Networks로 이름에서 알 수 있듯이 생성형 모델의 한 종류이다. "적대적 신경망"이라고도 불리는 이 모델은 서로 다른 두 개의 네트워크를 적대적(adversarial)으로 학습시키며 실제 데이터와 거의 유사한 데이터를 만들어 낸다. ( 생성된 데이터는 라벨 없음. 따라서 비지도 학습 ) GAN은 데이터의 확률 분포를 학습하여 실제 데이터와 유사한 가짜 데이터를 생성하는 Generator와 완성된 데이터가 원본 데이턴 지 생성된 데이턴지 판별하는 Discriminator로 구성되어 있다. 이 둘이 적대적 관계가 되어 G는 D를 속일만한, 원본 데..

2024 동계 모각코 2회차 결과
2024 동계 모각코 2024. 1. 11. 22:55

GAIN: Missing Data Imputation using Generative Adversarial Nets 논문 리뷰 포스팅 완료 https://illjuustory.tistory.com/203

article thumbnail
2024 동계 모각코 1회차 결과
2024 동계 모각코 2024. 1. 4. 20:01

imputatioin으로 꽤 유명한 논문 인 것 같아, GAIN: Missing Data Imputation using Generative Adversarial Nets 선택했다. 2회차에 걸쳐 논문을 리뷰하기로 계획했으며, 반 정도 정리하였다.

article thumbnail
[컴퓨터 네트워크] more) http
학교 공부 2023. 10. 15. 20:48

HTTP/1.1 Keep-Alive HTTP 1.1에서 커넥션을 재활용한다고 말했었다. header에 Keep-Alive 필드를 통해 이를 표기할 수 있다. 또한, 1.1 버전에서도 여러 개의 TCP와 연결하는데 이도 최대 제한수가 있다. 브라우저에서 도메인당 최대 연결제한을 걸고 있다. ( 그래서 성능이 좀 떨어진다.) HTTP/2 HTTP/2는 프로토콜을 다시 작성하는 것이 아니다. 기존의 method, sataus code api, 문법 등등 HTTP/1.x 것을 재활용한다. 사용자가 느끼는 대기 시간, 네트워크 및 서버 리소스 사용 등 오로지 프로토콜 성능향상에 중심을 둔다. 또한, 브라우저와 웹 사이트 간 single connection(단일 연결)만을 허용하는 것을 목표로 한다. 그래서 "도메..