본문 바로가기

Project5

피파온라인4 API 활용 데이터 분석 프로젝트(5) ⚽ 매치 상세기록 API 중 ShootDTO, PassDTO, DefenceDTO에 포함된 변수들의 분산분석을 통해 경기 결과에 따른 슈팅 횟수, 패스 횟수 등의 차이를 검정해보려고 한다. 분산분석을 하는 이유는 승리에 영향을 미치는 요인들을 보다 더 잘 파악하기 위해서이다. 현재 데이터는 총 200개의 관측값들로 이루어져있다. 나는 이 데이터를 전체 데이터/나의 데이터/ 상대방 데이터로 나누어 분산분석을 각 DTO에 3번씩 진행했다. 이렇게 한 이유는 다음과 같다. 하나, 전체 데이터를 통해 경기결과에 따라 유의미한 차이가 있는 변수들을 확인할 수 있다. 둘, 나의 데이터를 통해 나의 공식 경기 결과에 따라 유의미한 차이가 있는 변수들을 확인할 수 있다. 셋, 상대방 데이터를 통해 상대방들의 공식 경기.. 2021. 3. 2.
피파온라인4 API 활용 데이터 분석 프로젝트(4) ⚽ 매치 상세 기록 조회 API 중 MatchInfoDTO 변수들을 다양하게 시각화해보고 인사이트를 도출해보았다. 특히, 경기 결과에 따라 변수들을 비교분석 했으며, 아래의 결과들을 얻었다. 1. 최근 100경기를 보면, 게임 정지횟수, 파울 횟수, 부상 횟수, 레드카드, 옐로카드, 오프사이드 횟수는 경기 결과에 상관없이 모두 같은 형태를 띈다. (0~3 사이의 값을 가짐) 2. 경기결과에 따른 코너킥 횟수를 살펴보았고, 다음과 같은 인사이트를 얻을 수 있었다. 비겼을 경우를 제외하고 코너킥은 1번 진행된 경우가 가장 많았다. 승리했을 경우, 코너킥 2번의 빈도가 두번째로 높았다. (하지만, 경기 중 총 2번 진행 됐으므로, 내가 코너킥을 얻어 골 넣은 비율이 많은 것인지 상대방이 코너킥을 얻은 것인지 .. 2021. 2. 6.
피파온라인4 API 활용 데이터 분석 프로젝트(3) ⚽ 최근 100경기 경기 결과 비율과, 평일/주말의 시간대에 따른 공식경기 승률을 그래프로 그려보았다. 내가 생각했던 가설은 '저녁 시간이 새벽, 오전 시간보다 승률이 높을 것이다.' 이유는, 비진성 유저들의 유입이 주말에 많을 것이라 생각되기 때문이다. 최근 100경기 결과 총 42번 승리했으며, 그 중 몰수승은 3번이었다. 총 38번 패배했으며, 그 중 몰수패는 2번이었다. 무승부는 20번이었다. 시간대에 따른 승률 그래프 저녁 6시에 가장 높은 승률(75%)을 보였고, 저녁 7시에 가장 낮은 승률(22%)을 보였다. 한 시간 차이로 승률이 가장 높았다가 가장 낮았다. 이는 데이터가 많이 존재하지 않기 때문에, 저녁 시간대에 승률이 비교적 높다고 확정지을 수는 없을 것 같다. (더 많은 데이터를 모아.. 2021. 2. 1.
피파온라인4 API 활용 데이터 분석 프로젝트(2) ⚽ 넥슨 개발자센터 피파온라인4 API를 활용한 데이터 로딩, 로딩 중 에러 발생 원인과 해결책, 그리고 주의할 점을 기록하려 한다. 현재, 유저 정보 API를 활용해 유저 정보 데이터, 역대 최고 등급 데이터, 매치 기록 데이터, 매치 상세 기록 데이터를 로딩을 완료하여 Pandas의 DataFrame 형태로 만들었다. [데이터 부르기] 아래와 같은 순서대로 진행한다. 넥슨 개발자센터에서 api_key를 발급받는다. request 패키지를 활용하여 넥슨에서 제공해주는 API 정보를 호출한다. 2번에서 호출한 값을 json 형태로 바꾼다. 데이터프레임 형태로 변경한다. 위의 순서를 통해 유저의 닉네임으로 유저 고유 식별자 및 유저 정보를 호출해보고 데이터 셋을 만들어보자. headers = {'Autho.. 2021. 1. 19.