본문 바로가기

7. ML | DL | NLP

(24)
6/19(월) IT K-DT(73일차) / 18. CNN 기초 18. CNN(Convolutional Neural Networks) 18-1. CNN의 개요 CNN(컨볼루셔널 신경망)은 이미지 처리와 인식에 주로 사용되는 딥러닝 알고리즘임. 이미지를 입력으로 받아들이고, 이미지 내의 특징을 추출하여 해당 이미지가 어떤 카테고리에 속하는지 분류하는 작업을 수행함. 일반적인 신경망과는 달리 CNN은 이미지의 공간적 구조를 활용하여 특징을 추출하고 학습함. 이를 가능하게 하는 핵심 개념으로는 합성곱 연산(convolution)과 풀링(pooling)이 있음. 합성곱 연산(convolution)은 입력 이미지와 일련의 작은 필터(filter)를 곱하여 특징 맵(feature map)을 생성함. 필터는 이미지에서 특정한 패턴이나 특징을 찾는 역할을 수행하며, 엣지(edge)..
6/16(금) IT K-DT(72일차) / 15. 데이터로더~17.활성화함수 15. 데이터 로더 15-1. 손글씨 인식모델 만들기 # 필요한 라이브러리 및 모듈 불러오기 import torch import torch.nn as nn import torch.optim as optim import torchvision.datasets as datasets # torchvision에서 제공하는 다양한 데이터셋을 쉽게 다운로드하고 사용 import torchvision.transforms as transforms # 이미지에 대한 다양한 전처리 작업을 수행 import matplotlib.pyplot as plt from sklearn.datasets import load_digits # 교육간 이용할 손글씨 데이터셋 # GPU 장치 사용 예정 device = 'cuda' if torc..
6/15(목) IT K-DT(71일차) / 12.PyTorch~14.PyTorch구현-논리회귀 12. PyTorch 토치(Torch) 및 카페2(Caffe2)를 기반으로 한 딥러닝 라이브러리. 경쟁작으로 구글의 TensorFlow가 있음. 2017년 9월에 페이스북과 마이크로소프트가 협업하여 개발함. NumPy의 배열을 Tensor로 가져올 수 있고, 이를 쉽게 GPU상에 올려 연산을 가능하게 함. TensorFlow의 2.0버전 이후 자유로운 네트워크 수정의 난이도가 점점 높아진 이후 연구원들 사이에서는 PyTorch의 사용 비중이 높아지고 있는 추세. * 공식 웹사이트: https://pytorch.org/ PyTorch An open source machine learning framework that accelerates the path from research prototyping to ..
6/14(수) IT K-DT(70일차) / 11.KMeans 11. KMeans 11-1. cluster import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.datasets import make_blobs make_blobs(): 사이킷런(Scikit-learn) 라이브러리에서 제공하는 데이터셋 생성 함수 중 하나로, 지정된 개수의 클러스터를 생성하고, 각 클러스터 내의 데이터 포인트를 생성함. n_samples: 생성할 데이터의 총 개수 centers: 생성할 클러스터의 개수이자 각 클러스터의 중심 개수. X, y = make_blobs(n_samples=100, centers=3, random_state=10) X # 총 1..
6/13(화) IT K-DT(69일차) / 10.lightGBM 10.lightGBM 10-1. credit 데이터셋 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt credit_df = pd.read_csv('/content/drive/MyDrive/K-DT/머신러닝과 딥러닝/credit.csv') ▲ 위의 볼드체는 본인이 파일을 다운받은 경로를 입력 credit_df (Credit_Score를 독립변수로 사용할 예정. 전처리할 부분이 많은 까다로운 데이터셋임을 참고하자.) # df의 열을 모두 펼치기 pd.set_option('display.max_columns', 50) credit_df.head() # info 확인 cre..
6/12(월) IT K-DT(68일차) / 7.로지스틱회귀~9.랜덤포레스트 7. 로지스틱 회귀(Logistic Regression) 통계학과 머신 러닝에서 사용되는 분류 알고리즘. 이 알고리즘은 입력 변수와 출력 변수 사이의 관계를 모델링하고, 주어진 입력 값에 대해 출력 값을 예측하는 데 사용됨. 로지스틱 회귀는 이름은 회귀(regression)를 포함하나, 이진 분류(binary classification)에 주로 사용됨. 이는 입력 변수를 기반으로 주어진 데이터 포인트가 두 개의 클래스 중 하나에 속하는지 예측하는 것을 의미. 로지스틱 회귀의 핵심 아이디어는 선형 회귀와 로지스틱 함수인 시그모이드 함수(sigmoid function)를 조합하는 것임. 로지스틱 회귀는 입력 변수의 선형 조합을 계산한 후, 이 값을 시그모이드 함수에 적용하여 0과 1 사이의 확률 값으로 변환..
6/9(금) IT K-DT(67일차) / 5.선형회귀~6.의사결정나무 5.선형회귀 5-2. 선형 회귀(Linear Regression) 가장 널리 사용되는 회귀 분석 방법 중 하나. 데이터의 분포를 가장 잘 설명하는 직선을 찾아내는 방법. * 단순 선형 회귀 분석: 단일 독립변수를 이용. * 다중 선형 회귀 분석: 다중 독립변수를 이용. # 선형회귀와 관련된 모듈 from sklearn.linear_model import LinearRegression # lr이라는 선형회귀의 객체 생성 lr = LinearRegression() # 학습 lr.fit(X_train, y_train) # X_test를 입력했을 때의 예측결과 출력 pred = lr.predict(X_test) 5-3. 평가지표 만들기 5-3-1. MSE(평균제곱근오차. Mean Squared Error) 예측..
6/8(목) IT K-DT(66일차) / 1.머신러닝~5.선형회귀 1. 머신러닝 인공지능: 인공(Artificial) + 지능(Intelligence) 머신러닝: 데이터를 기반으로 한 학습(learning)하는 기계(machine) 딥러닝: 깊은(deep) 신경망 구조의 머신러닝(machine learning) 머신러닝의 배경 과거 컴퓨터로 데이터를 읽어들이고, 데이터 안에서 특징을 학습하여 패턴을 찾아내는 작업 → 패턴인식 데이터를 대량으로 수집/처리할 수 있는 환경이 갖춰짐으로 할 수 있는 일들이 많아짐. 머신러닝은 데이터로부터 특징이나 패턴을 찾아내는 것이기 때문에 데이터가 가장 중요. 머신러닝의 정의 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘/기술을 개발하는 분야 '무엇(x)으로 무엇(y)을 예측하고 싶다'의 f(함수)를 찾아내는 것 y: 출..