텍스트 분석2 DACON 금융문자 분석 경진대회 도전2 1. 지난 이야기 DACON은 정확도로 랭킹을 매긴다. 정확도는 맞춘 개수/전체 개수 한 쪽으로 편향되게 예측해도 정확도가 높을 수 있다는 얘기다. 즉, 스미싱이 아니다라고 다 예측하면 정확도가 높아질 수 있다. 2. 모든 값을 0으로 입력 3. 모든 값 0의 점수 0.423인데 생각해보니 smishing 값은 0과 1이 아니라 0에서 1 사이의 실수이므로 all 0이나 all 1을 생각한 것은 바보같은 짓이었다. 흠 그러면 기본적인 Random Forest를 적용해보자. 4. Random Forest https://github.com/corazzon/KaggleStruggle/blob/master/word2vec-nlp-tutorial/tutorial-part-1.ipynb corazzon/Kaggle.. 2019. 12. 27. DACON 금융문자 분석 경진대회 도전 DACON 금융문자 분석 경진대회를 한다고 한다. 총 상금 2000만원😎 [대회] 14회 금융문자 분석 경진대회 - A. 대회 설명 & 데이터 다운로드 1. 배경 올해 1월부터 7월까지 스미싱 범죄 건수는 17만6220건으로 지난해 같은 기간(14만5093건)에 비해 21.5% 증가했습니다. 특히 최근 교묘하고 지능적인 스미싱 문자 패턴으로 인해 고객들의 피해가 증가하고 있습니다. 이를 방지하기 위해 kb 금융그룹과 KISA는 데이코너들에게 도움을 요청합니다. 총 글자수 50,000,000개의 데이터를 활용해 스미싱 탐지 모델을 개발하고 명예와 상금을 동시에 누리세요! ... dacon.io Ranking에서 위를 올려보니... 아래를 내려다보니... 제출만 해도 200위권이 가능하다!! 바로 ㄲㄲ!! .. 2019. 12. 22. 이전 1 다음