이전 글에 이어 AutoEncoder를 이용한 타이타닉 문제 접근의 최종 편입니다. 이전 편에서 AutoEncoder를 통해 케글에서 제공하는 타이타닉 데이터를 차원 축소해보았습니다. Bytenet의 AutoEncoder의 encoder 를 통과하면…
케글에서 가장 초보적인 문제 타이타닉 생존자 예측 문제(https://www.kaggle.com/c/titanic/data)를 AutoEncoder로 접근해보려고 합니다. 이 문제는 케글에서 워낙 유명한 문제이기 때문에 competition의 리더보드를 보면 score가 1입니다.(정확도 100%..) AutoEncoder로…
이글은 Transformer 모델(BERT/GPT 등)의 Library 인 hugging face를 활용한 generator 학습을 위한 글입니다. 모든 내용은 https://huggingface.co/blog/how-to-generate 을 참고하였습니다. 의미 있는 sequence 있는 생성을 위한 학습…
LOL 게임 데이터를 바탕으로 RNN을 이용해 18레벨까지의 skill 시퀀스를 만들어보는 작업을 하고 있습니다. 이 toy 과제의 목적은 학습된 모델이 생성하는 시퀀스가 게임의 규칙을 이해한 skill…
[M/L]LOL 데이터를 활용한 Skill 트리 학습(3) 에 이어 진행합니다. 이전 학습에서 tensorflow의 dataset api 를 이용해 dataset을 구성한 후에는 데이터를 수정하는것이 굉장히 힘든일인것을 알게 되었습니다.…
[M/L]LOL 데이터를 활용한 Skill 트리 학습(2) 에 이어 진행합니다. 기존의 N-gram 형태의 rnn 으로는 원하는 결과가 나오지 않아 Tensorflow 공식 홈페이지의 RNN Tutorial를 참고해서 진행해보았습니다.…
[M/L]LOL 데이터를 활용한 Skill 트리 학습(1)에 이어 진행합니다. 수집된 데이터 set 은 아래와 같습니다. 2번째 column의 데이터가 프로게이머들이 선택한 skill sequence 입니다. 경기에 따라 18…
LOL에서는 다양한 게임 데이터를 User 들에게 Open 하고 있습니다. 단순 유저별 승패 뿐만 아니라 피해량, 아이템 구매 이력, Skill 트리 등 여러 정보를 공유하고 있는데…