본문 바로가기

IT공부9

머신러닝 학습방법 파이프라인 및 데이터 전처리 *머신러닝 학습방법 a. 지도학습: 문제,정답을 알려주고 학습 -분류: 학습데이터를 이용하여 입력값이 어떤 종류인지 분류. ex) AI 스피커, 음성인식 로지스틱회귀, SVM, KNN, 결정트리, 랜덤포레스트, 퍼셉트론, 신경망 -예측: 학습데이터를 이용하여 연속적인 숫자 값을 예측. 선형회귀, 다항식회귀, 릿지회귀, 라쏘회귀, 일래스틱넷 b. 비지도학습: 답을 알려주지 않고 학습 -군집: 학습데이터 특성에 따라 유사한 것으로 군집. 계층적군집화, K-means, SOM, EM 알고리즘 -연관규칙: 특정 사건들의 발생빈도를 통해 상호연관성을 표현하는 규칙. ex)추천 지지도, 신뢰도, 향상도, Apriori c. 강화학습: 보상을 통해 상을 최대화하는 방향으로 행위를 강화하는 학습 *머신러닝 파이프라인 .. 2023. 4. 25.
머신러닝 학습알고리즘-SVM,KNN,의사결정나무,랜덤포레스트,앙상블,로지스틱 회귀,선형회귀 머신러닝 학습알고리즘에 대해 학습해보고자 한다. SVM,KNN,의사결정나무,랜덤포레스트,앙상블,로지스틱 회귀,선형회귀 등 7가지 알고리즘에 대해 확인해보고자 한다. *SVM(Support Vector Machine) 주어진 데이터들을 가능한 멀리 두개의 집단으로 분리시키는 최적의 초평면을 찾는 분류모델 알고리즘. *KNN(K-Nearest Neighbor) 새로운 fingerprint 를 기존 클러스터 내의 데이터와 instance 기반거리를 측정하여 가장 많은속성을 가진 클러스터에 할당하는 분류알고리즘. *의사결정나무(Decision Tree) 의사결정규칙을 도표화->관심대상이 되는 그룹을 소그룹으로 분류-> 예측을 수행하는 기법. 순환적 분할(Recursive Partitioning) 방식을 이용한 .. 2023. 4. 25.
딥러닝 실습 1. 딥러닝 Flow In [5]: import numpy as np from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from keras import optimizers In [17]: #데이터셋 설정 time = np.array([1,2,3,4,5]) score= np.array([10,20,30,60,66]) In [18]: #모델구성 model=Sequential() model.add(Dense(1,input_dim=1, activation='linear')) #선형회귀 In [19]: #모델컴파일 sgd= optimizers.SGD(lr=0.01) model.compile(.. 2020. 11. 1.
라이브러리-Pandas Pandas¶ In [1]: import pandas as pd 1. 파일에서 data 갖고오기(Data Frame)¶1.1 pd.read_csv(파일명)¶ In [2]: #갖고오기 (comma ,) df1 = pd.read_csv('test.csv') #tab으로 구분 df2 = pd.read_csv('test_tab.txt',delimiter='\t') #header 없는경우 df3 = pd.read_csv('test_noheader.csv',header=None) df3.columns = ['a','b','c'] #header 없는경우2 df4 = pd.read_csv('test_noheade.. 2020. 11. 1.