본문 바로가기

프로그래밍18

[Python] Optuna 사용법 예측 모델링을 구축한 후에 모델의 성능을 조금이라도 더 향상하기 위해서는 최적의 하이퍼 파라미터를 찾아 적용하는 방법이 있다. 기존에 내가 해왔던 하이퍼파라미터 방법은 사이킷런의 GridSearchCV 패키지를 활용해 찾는 방법이었다. 하지만, 이는 시간이 조금 오래 걸릴 뿐만 아니라, 하이퍼 파라미터 값을 직접 지정해주어야 한다는 단점이 있다. Optuna도 물론 값을 지정해주어야 하지만, 조금 더 러프하게 값을 지정해주면, Optuna가 범위내에서 자동탐색을 통해 최적의 하이퍼파라미터를 도출해준다는 점과 시간이 조금 더 빠르다는 점에서 GridSearchCV보다 좋은 것 같다. import optuna from optuna import Trial, visualization from optuna.sam.. 2021. 7. 7.
Plotly 사용법 Dacon 대회의 코드 공유를 보면서 Plotly를 알 수 있었고 동적인 그래프인데, 몇 줄 안되는 코드로 구현되는 것이 정말 신기했고 기초부터 조금씩 알아보자는 의도로 글을 작성하게 되었다. plotly 공식 홈페이지에서 예제들을 보고 정리한 글이다. Plotly 패키지는 Interactive한 그래프로 동적인 그래프를 만들 수 있다. 기본적인 사용 방식은 아래와 같다. from plotly.subplots import make_subplots import plotly.graph_objects as go fig = make_subplots(rows = n, cols = r) # 행과 열의 숫자를 지정해주면 원하는 axes만큼의 그래프가 생성된다. fig.add_trace(go.Scatter(x = [1.. 2021. 7. 5.
[MySQL] 재귀 (RECURSIVE) 테이블 생성 CTE (Common Table Expression)을 활용하여 재귀 테이블을 생성할 수 있다. CTE를 활용하게 된다면, 재귀 쿼리를 이용해 메모리 상에 가상의 테이블을 저장하게 된다. 이를 통해, 시간대를 생성해서 다른 테이블과 조인하여 다양하게 사용할 수 있다. 사용법은 아래와 같다. WITH RECURSIVE 테이블명 AS ( SELECT 초기값 AS 컬럼명 UNION ALL SELECT 컬럼명 재귀 조건 FROM 테이블명 WHERE 제어문 ) 예시를 살펴보자 2021. 7. 1.
[SQL] 데이터 캠프 수강 (11) - Reporting in SQL 이번 강의는 아래 4개의 단원으로 구성되어 있다. Exploring the Olympics Dataset Creating Reports Cleaning & Validation Complex Calculations [Chapter1] E:R 다이어그램을 보면서 테이블 간의 결합을 통한 데이터 추출을 진행했다. 주의할 점으로는 테이블을 결합하고 추출하는 과정에서 중복, 합산 등의 문제가 발생할 수 있으므로 데이터의 정합성을 체크하자. [Chapter2] 효율적인 코딩 프로세스 작성하는 법 What tables do we need to pull from? How should we combine the tables? What fields do we need to create? What filters need t.. 2021. 5. 23.