📓 배우고 해낸 것머신러닝 과제 제출알고리즘 코드카타 머신러닝 퀴즈 제출특강 참여(머신러닝 강의 3개, 퀴즈해설 1개)개인 실습 환경 VPN 세팅 완, 접속 완 👍🏻 칭찬할 점머신러닝 과제 (내 기준 80% 완성도, 20% 신뢰도 이지만..) 해냄.. 어찌저찌..알고리즘 코드카타 5일 내내 진행 완! 심지어 마지막날은 어쩐 일로 혼자 풀기 성공! 👎🏻 개선할 점TIL 작성 다시 꾸준히..머신러닝 진입장벽 뭐냐.. 머리가 복잡복잡..내 개인 공부 다시 되돌리기.. 실습 환경 써먹자!! 💗 느낀점월요일에 실험실 선배님을 통해서 선배님이 만들어주신 서버 환경에 접속하고 환경 설정을 해냈다. 무려 1시간 반동안... 선배와 연락을 하며 세팅하는데.. 새로 배우는 용어와 세계에 머리가 어질어질 했다..
전체 글
🥔💬➡✍🏻➡🍟✨✳️ join: '문자형' iterable 한 자료 구조에 특정 구분자를 추가하여 문자열로 반환 🟡 형식 '구분자'.join(리스트) 🔵 예시str형 리스트, 구분자 : '-'list = ['여', '행', '가', '고', '싶', '다']'-'.join(list) str형 리스트, 구분자 : ''list = ['여', '행', '가', '고', '싶', '다']''.join(list) str형 리스트, 구분자 : '.'list = ['여', '행', '가', '고', '싶', '다']'.'.join(list) 구분자에 이스케이프 문자 사용하기(\n)list = ['여', '행', '가', '고', '싶', '다']a = '\n'.join(list)print(a) 다양한 구분자 사용해보기 (,와 ..
📓 배우고 해낸 것머신러닝 강의 완강 및 정리코드카타 복귀 👍🏻 칭찬할 점머신러닝 심화 강의를 완강하고 정리를 나름 다 해낸 점코드카타 다시 복귀! 힘들어도 열심히 해봄! 👎🏻 개선할 점코드카타를 통해 파이썬의 다양한 코드에 익숙해지기머신러닝을 좀 더 딥하게 공부해보기? 클러스터링 쪽..!리눅스는 뭔가 실습을 하면서도,, 와닿지가 않는다ㅠ 기본적인 명령어가 뭐가 있는지 눈에 익히는 쪽으로 공부! 💗 느낀점이번 주는 머신러닝을 배우는 주간이었다. 정말정말 궁금했던 내용을 듣고 나니 머리가 어질어질하긴 했다 ㅎ 강의 내용을 블로그에 정리를 했기 때문에 다시 복습을 하면서 확실하게 익혀야겠다. 이번주에 머신러닝 과제가 있는데 그걸 통해서 좀 더 익숙해지고 공부하는 시간을 가지면 좋겠다고 생각했다. 아직 1번밖..
✳️ 딥러닝 실습이번 실습에 사용할 패키지에 대한 정보 https://www.tensorflow.org/api_docs/python/tf/keras/Model#fit tf.keras.Model | TensorFlow v2.16.1A model grouping layers into an object with training/inference features.www.tensorflow.org https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense tf.keras.layers.Dense | TensorFlow v2.16.1Just your regular densely-connected NN layer.www.tensorflow.org 패키지..
✳️ 딥러닝과 머신러닝⭐ 공통점데이터로부터 가중치를 학습하여 패턴을 인식하고 결정을 내리는 알고리즘 개발과 관련된 인공지능(AI)의 하위 분야 ⭐ 차이점머신러닝 : 데이터 안의 통계적 관계를 찾아내며 예측이나 부류를 하는 방법딥러닝 : 머신러닝의 한 분야로 신경세포 구조를 모방한 인공 신경망을 사용함 ✳️ 딥러닝 이론⭐ 인공 신경망(Artificial Neural Networks): 인간의 신경세포를 모방하여 만든 망(Networks)✨ 신경세포 : 이전 신경세포로 들어오는 자극을 이후 신경세포로 전기신호로 전달하는 기능을 하는 세포 ⭐ 퍼셉트론(Perceptron): 인공 신경망의 가장 작은 단위 🥸 키와 몸무게 데이터를 가지고 퍼셉트론을 그려본다면?몸무게와 키 데이터Y : 키X : 몸무게$w_..
✳️ 고객 세그멘테이션고객 세그멘테이션(Customer Segmentation)은 다양한 기준으로 고객을 분류하는 기법CRM(고객 관계 관리, Customer Relationship Management) 분야가 비지도 학습이 가장 많이 사용돼서 해당 분야 데이터로 실습해보자!데이터는 RFM을 기반으로 가공할 것이다. 💟 RFM의 개념Recency(R) : 가장 최근 구입 일에서 오늘까지의 시간Frequency(F) : 상품 구매 횟수Monetary value(M) : 총 구매 금액 ✳️ 실습하기1️⃣ 데이터 불러오기# 엑셀 파일을 불러오기 위해 패키지 설치! pip install openpyxlretail_df = pd.read_excel('C:/Users/82109/OneDrive/문서/ML/Onl..
✳️ 비지도 학습답을 알려주지 않고 데이터 간 유사성을 이용해서 답을 지정하는 방법데이터를 기반으로 레이블링하는 작업정답이 없는 문제이기 때문에 지도 학습보다 조금 어렵고 주관적인 판단이 개입대표적인 비지도 학습으로는 K-평균 군집화(K-means clustering) ✳️ K - Means Clustering💟 수행 순서 K개 군집 수 설정임의의 중심을 선정해당 중심점과 거리가 가까운 데이터를 그룹화데이터의 그룹의 무게 중심으로 중심점 이동중심점을 이동했기 때문에 다시 거리가 가까운 데이터를 그룹화(* 3 ~ 5번 반복) 😇 장점일반적이고 적용하기 쉬움 👿 단점거리 기반으로 가까움을 측정하기 때문에 차원이 많을 수록 정확도가 떨어짐반복 횟수가 많을 수록 시간이 느려짐몇 개의 군집(K)을 선정할..
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.preprocessing import LabelEncoderfrom sklearn.tree import DecisionTreeClassifier, plot_treetitanic_df = pd.read_csv('C:/Users/82109/OneDrive/문서/ML/titanic/train.csv')타이타닉 데이터를 이용하여 의사결정 나무를 그려보자! ✳️ 의사결정 나무(Decision Tree) 실습먼저 이용할 변수들에 대해 처리해줘야할 전처리 실시X_features = ['Pclass', 'Sex', 'Age']# Pclass : 라벨인코딩# Sex : 라벨인..
지금까지 선형회귀와 로지스틱회귀를 배웠는데, 이 외에 자주 쓰는 분류와 회귀에 대한 알고리즘들을 학습하는 시간을 가졌다. ✳️ 의사결정나무(Decision Tree, DT): 의사결정규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법 💟 명칭루트 노드(Root Node) : 의사결정나무의 시작점. 최초의 분할조건리프 노드(Leaf Node) : 루트 노드로부터 파생된 중간 혹은 최종 노드분류기준(criteria) : sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로, 남성인 경우 우측 노드로 분류불순도(impurity)불순도 측정 방법 중 하나인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스)..
타이타닉 데이터를 이용하고, 살아남은 승객을 예측하는 모델을 만들어서 train과 test를 구분 지어두고 train 데이터로 모델을 학습 시킨 뒤, test 데이터에 적용하여 결과를 토대로 얼마나 예측을 잘 해냈는지 캐글에서 확인해보기! import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns먼저 필요한 라이브러리들을 불러온다. ✳️ 데이터 로드 & 분리train / test 데이터 분리train_df = pd.read_csv('C:/Users/82109/OneDrive/문서/ML/titanic/train.csv')test_df = pd.read_csv('C:/Users/82109/OneDri..