Shine's dev log

Link

ME
GitHub

Recent Posts

Recent Comments

Today

Total

관리 메뉴

목록전체 글 (111)

Shine's dev log

[ML] Deepfake Detection 성능 분석

0. 프로젝트 소개 빅데이터응용 보안 수업시간에 팀 프로젝트로 진행했던 프로젝트를 소개해본다.프로젝트 주제는 Deepfake Detection 성능을 분석하는 것으로, 총 4명의 팀원들과 협력하여 진행하였다. 우선 deepfake detection과 관련된 논문을 분석한 뒤, 사용할만한 데이터셋을 탐색하고 전처리, 학습, 최적화 등의 과정을 거쳐 프로젝트를 진행하였다. 1. Introduction 최근 딥러닝 기술의 발전으로 Deepfake 와 같이 동영상에 특정 인물의 얼굴을 합성하는 사례가 증가하고 있다. Deepfake 기술은 다양한 분야에 적용될 수 있어 앞으로 그 수요가 증가할 것으로 예상된다. 하지만 deepfake 기술을 이용해 사기, 허위 음란물, 가짜 뉴스 등의 새로운 범죄에 악용될 위험..

머신러닝 2022. 2. 26. 03:44

KL divergence와 JSD의 개념 (feat. cross entropy)

1. KLD / JSD 얼마전 GAN 논문을 읽는데 KLD, JSD에 관한 내용이 나왔다. 그냥 단순히 두 확률분포 간의 distance를 나타내는 divergence라고 생각했는데, 사실은 이게 아니라 더 심오한 내용이 있어서 정리해보겠다. 2. KL divergence (Kullback-Leibler divergence) 2.1. KL divergence의 의미 위키백과에서는 KL divergence를 다음과 같이 정의하고 있다. 쿨백-라이블러 발산(KLD)은 두 확률분포의 차이를 계산하는 데에 사용하는 함수로, 어떤 이상적인 분포에 대해, 그 분포를 근사하는 다른 분포를 사용해 샘플링을 한다면 발생할 수 있는 정보 엔트로피 차이를 계산한다. 쿨백-라이블러 발산은 어떠한 확률분포 P가 있을 때, 샘플..

머신러닝 2022. 2. 19. 04:41

[논문] Generative Adversarial Nets

논문 제목 : Generative Adversarial Nets 0. abstract 본 논문에서는 adversarial process를 통한 generative model을 estimate 하는 새로운 프레임워크, GAN을 제안한다. GAN에서는 동시에 2개의 모델을 학습시킨다. 첫번째 모델은 데이터를 생성하는 generative model G 이고, 두번째 모델은 데이터의 진위여부를 판별하는 discriminative model D 이다. G는 최대한 D가 실수를 하도록 하는 것, 즉 G가 만든 데이터와 실제 데이터를 D가 판별 못하도록 하는 것이 목적이다. G와 D 모델이 multilayer perceptron 구조를 가지고 있다면, backpropagation을 통해 학습이 가능하다. GAN을 이..

논문 2022. 2. 8. 22:44

[Recommender system] 영화 추천 시스템

1. 개요 사용자로부터 특정 개수 (5개 정도)의 선호하는 영화를 선택받으면, 해당 사용자가 좋아할만한 영화를 추천해주는 영화 추천 시스템을 만들었다. 영화를 추천해주는 방법은 아래와 같이 2가지가 있다. 1) 사용자가 선호하는 영화와 유사한 영화를 추천 2) 다른 사용자들의 평가를 바탕으로 선호할만한 영화를 추천 코드는 아래에서 확인할 수 있다. https://github.com/godeastone/movies-recommendation 2. Abstract 본 프로젝트에서는 사용자가 선호하는 영화 5개를 바탕으로 간단하게 사용자에게 볼만한 영화를 추천해주는 시스템을 제안한다. 본 시스템은 크게 2가지 방식으로 영화를 추천한다.첫번째 방식은 사용자가 선택한 영화와 자주 같이 시청된 영화들 중, ..

머신러닝 2022. 1. 23. 14:30

PCA (Principal Component Analysis) : 주성분 분석 이란?

1. PCA (주성분 분석) PCA는 대표적인 dimensionality reduction (차원 축소)에 쓰이는 기법으로, 머신러닝, 데이터마이닝, 통계 분석, 노이즈 제거 등 다양한 분야에서 널리 쓰이는 녀석이다. 쉽게 말해 PCA를 이용하면 고차원의 데이터를 낮은 차원의 데이터로 바꿔줄 수 있다는 것인데, 중요한 것은 "어떻게 차원을 잘 낮추느냐" 이다. 예를 들어 아래 [그림 1] 에서 왼쪽에 있는 2차원 데이터를 오른쪽에 있는 1차원 데이터로 바꾼다고 생각해보자. 아무리 잘 바꾼다고 하더라도, 2차원의 데이터의 특징을 모두 살리면서 1차원의 데이터로 바꿔줄수는 없을 것이다.그렇다면 차선책으로, 모든 특징을 살릴 수는 없을지라도 최대한 특징을 살리며 차원을 낮춰주는 방법을 고안하기 시작했고, 그..

머신러닝 2021. 12. 21. 03:57

[논문] Detecting Credential Spearphishing Attacks in Enterprise Settings

논문 제목 : Detecting Credential Spearphishing Attacks in Enterprise Settings 0. Abstract 본 논문에서는 enterprise 환경에서 credential spearphishing 공격을 탐지하는 새로운 방안을 제시한다. 제안된 시스템에 사용된 feature는 spearphishing 공격의 특징을 반영한 feature를 사용하며, 새로운 non-parametric anomaly scoring technique 기술과 결합하여 사용한다. 본 시스템을 수년간 수집된 수신 이메일 데이터셋에 적용하여 평가한 결과, 다양한 spearphishing 공격을 탐지할 수 있었으며, 또한 본 시스템의 FP rate가 매우 낮아 실용적이며, 기존의 방법보다 훨..

논문 2021. 12. 14. 17:06

이전 Prev 1 2 3 4 5 ··· 19 Next 다음

목록전체 글 (111)

Shine's dev log

티스토리툴바