no image
[머신러닝과 딥러닝] 6. 의사 결정 나무
1. bike 데이터셋 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns bike_df = pd.read_csv('/content/drive/MyDrive/KDT v2/머신러닝과 딥러닝/ data/bike.csv') bike_df.info() sns.displot(bike_df['count']) sns.boxplot(y=bike_df['count']) sns.scatterplot(x='feels_like', y='count', data=bike_df, alpha=0.3) sns.scatterplot(x='pressure', y='count', data=bike_df, ..
2023.12.29
no image
[머신러닝과 딥러닝] 5. 선형 회귀
1. Rent 데이터셋 # 필요한 데이터셋 로그 및 탐색 import numpy as np import pandas as pd import seaborn as sns rent_df = pd.read_csv('/content/drive/MyDrive/KDT v2/머신러닝과 딥러닝/ data/rent.csv') rent_df # rent_df의 파일내용 확인 rent_df.info() # 데이터프레임에 대한 기술 통계를 빠르게 요약하여 보여줍니다. rent_df.describe() count : 각 컬럼의 유효한 데이터 개수입니다. 결측치는 제외. mean : 수치 데이터에 대한 평균값 std : 표준편차로, 데이터의 분산 정도 min : 각 컬럼의 최소값 25% : 하위 25%(1사분..
2023.12.28
no image
[머신러닝과 딥러닝] 4. 타이타닉 데이터셋
1. 캐글(Kaggle) https://kaggle.com 구글에서 운영하는 전세계 데이터 사이언티스트들이 다양한 데이터를 분석하고 토론할 수 있도록 제공하는 커뮤니티 데이터 분석 및 머신러닝, 딥러닝 대회를 개회 많은 데이터셋, 파이썬 자료, R자료 등... 제공 Kaggle: Your Machine Learning and Data Science Community Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals. www.kaggle.com 2. 데이콘(Dacon) https://dacon.io/ 국내 최초 AI 해커톤 ..
2023.12.27
no image
[머신러닝과 딥러닝] 3. 아이리스 데이터셋
1. Iris DataSet 데이터셋 : 특정한 작업을 위해 데이터를 관련성 있게 모아놓은것 https://scikit-learn.org/stable/modules/classes.html?highlight=datasets#module-sklearn.datasets API Reference This is the class and function reference of scikit-learn. Please refer to the full user guide for further details, as the class and function raw specifications may not be enough to give full guidel... scikit-learn.org 1. 데이터 세트 로드 및 탐색 ..
2023.12.23
no image
[머신러닝과 딥러닝] 2. 사이킷런(Scikit-learn)
1. 사이킷런이란? 대표적인 파이썬 머신러닝 모듈 다양한 머신러닝 알고리즘을 제공 다양한 샘플 데이터를 제공 머신러닝 결과를 검증하는 기능을 제공 BSD 라이선스이기 때문에 무료로 사용 및 배포가 가능 사이킷런 공식 홈페이지(https://scikit-learn.org/stable/) 2. LinearSVC 클래스를 구분으로 하는 분류 문제에서 각 클래스를 잘 구분하는 선을 그려주는 방식을 사용하는 알고리즘 지도학습 알고리즘을 사용하는 학습 전용 데이터와 결과 전용 데이터를 모두 가지고 있어야 사용이 가능 필요 모듈 임포트 및 코드 from sklearn.svm import LinearSVC # LinearSVC는 선형 서포트 벡터 분류기로, 데이터를 분류하는 데 사용됩니다. from sklearn.me..
2023.12.22
no image
[머신러닝과 딥러닝] 1. 개요
1. 머신러닝이란 인공지능 : 인공(artificial) + 지능(Interlligence) 즉, 개발자에 의한 인공지능, 데이터에 의한 인공지능을 뜻합니다. 머신러닝 : 데이터를 기반으로 한 학습(learning)하는 기계(machine)를 뜻합니다. 딥러닝 : 깊은(deep) 신경망 구조의 머신러닝을 뜻합니다. 1-1. 배경 과거 컴퓨터로 데이터를 읽어들이고, 데이터 안에서 특징을 학습하여 패턴을 찾아내는 작업 즉, 패턴인식 데이터를 대량으로 수집 처리할 수 있는 환경이 갖춰짐으로 할 수 있는 일들이 많아짐 머신러닝은 데이터로부터 특징이나 패턴을 찾아내는 것이기 때문에 데이터가 가중 중요함. 1-2. 정의 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야 "무엇(x..
2023.12.21