전체 글

🥔💬➡✍🏻➡🍟✨
✳️ 할당 (Assignment)값을 할당하는 것인데 보통은 오른쪽의 값을 왼쪽 변수에 할당한다 라는 흐름이다.다양한 할당연산자가 있다. 리스트 a를 b에 할당a = [1, 2, 3]b = a이렇게 a 리스트를 b라는 변수에 할당을 해봤다.그렇다면 리스트는 2개가 생성된 것일까?a is b # Truea와 b가 같다가 true로 나온다.이름은 다르지만 사실은 같은 리스트로 하나의 리스트에 두 개의 이름.. 이런 식이었다.b[1] = 10print(a)# [1, 10, 3]print(b)# [1, 10, 3]그래서 b 리스트에 1번 인덱스의 값을 10으로 바꿔주면 a와 b를 출력했을 때 모두 값이 변경된다.그림으로 보자면 이런 식으로 하나의 리스트임을 알 수 있다.  ✳️ 복사 (Copy).copy( ) ..
2024.07.12    🔒 20번) 데이터를 로드하라DataUrl : 'https://raw.githubusercontent.com/Datamanim/pandas/main/chipo.csv'🔓 해결 방법import pandas as pddf = pd.read_csv('https://raw.githubusercontent.com/Datamanim/pandas/main/chipo.csv')df   🔒 21번) quantity 컬럼 값이 3인 데이터를 추출하고 첫 5행을 출력하라quantity 컬럼 중에 값이 3인 데이터들만 추출, 그리고 위에서부터 5행만 출력🔓 해결 방법df[df['quantity'] == 3].head(5)df['quantity'] == 3먼저 요것의 뜻은.. 데이터 값이 3인 ..
2024.07.11   ✳️ 산포도 (Dispersion): 관찰된 데이터가 흩어져 있는 정도. 분산도 (Degree of dispersion), 변산성 (Variability) 이라고도 한다.다음은 산포도의 지표의 종류를 정리하였다. 1️⃣ 범위 (Range): 최대값 - 최소값자료의 퍼짐 정도를 가장 쉽게 나타낼 수 있다.두 자료가 넓게 퍼져 있으면 범위는 커지고 모여 있으면 작아진다.계산하기는 쉽지만 양쪽 극단값에 지나치게 좌우된다. 2️⃣ 사분위간 범위 (Interquartile range, IQR): IQR = Q3 - Q1전체 데이터를 25% 단위로 나눌 수 있는 Q1(1사분위수), Q2(2사분위수), Q3(3사분위수)를 말한다.제 1사분위수와 제 3사분위수의 범위가 사분위간 범위사분위수(Qu..
2024.07.11오늘도 판다스 모듈을 사용해보면서 여러가지 method를 사용하는 연습을 해봤당..판다스 참 좋더라...  🔒 7번) 데이터셋의 인덱스 구성은 어떻게 되는가?인덱스 구성을 구하라는 말이 조금 이상하지만.. 앞에 라벨링처럼 되어있는 인덱스의 번호와 간격을 구하라는 것 같다. 🔓 해결 방법먼저 데이터셋을 전부 불러와 보면 맨 앞 줄에 굵은 글씨로 된게 인덱스!df.index().index( ) 를 사용하면 전체 데이터의 index의 시작부터 끝 번호와 간격의 범위를 알려준다.  🧐 그렇다면 특정 컬럼의 데이터 값으로 정렬해서 데이터를 재구성하면 index 구성이 어떻게 될까!# 'gameDuration'이라는 컬럼으 값으로 정렬을 해보았다.df.sort_values('gameDurat..
2024.07.10오늘은 아래 사이트에서 아주 초반 부분을 다뤄보며 스터디를 하기로 했기 때문에 풀어본 순서대로 적어보았다.나는 데이터 전처리 100문제 content 1번 getting & knowing data 의 1번 ~ 5번을 풀기로 배정 받았다. 나머지도 차차 해볼 예정이다.https://www.datamanim.com/dataset/99_pandas/pandasMain.html#getting-knowing-data 판다스 연습 튜토리얼 — DataManimQuestion 43 df의 데이터 중 new_price값이 lst에 해당하는 경우의 데이터 프레임을 구하고 그 갯수를 출력하라 lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98]www.dat..
2024.07.09많은 말을 하지 않고 사진으로 나의 심정을...  ✳️ While 문- 조건을 만족하는 동안 코드 블록을 반복 실행- 특정 조건이 참(true)일 때만 실행되며 조건이 거짓(false)이 될 때까지 반복while 조건: # 조건은 불리언 값을 반환하는 표현식 코드_블록 예시)tree_hit = 0while tree_hit 나무를 1번 찍었습니다.나무를 2번 찍었습니다. 나무를 3번 찍었습니다. 나무를 4번 찍었습니다. 나무를 5번 찍었습니다.나무를 6번 찍었습니다. 나무를 7번 찍었습니다. 나무를 8번 찍었습니다. 나무를 9번 찍었습니다. 나무를 10번 찍었습니다.✅ While 문과 break 문# 반복 카운트를 위한 변수 초기화count = 0# 무한 루프while..
✳️ UNION / UNION ALL - 합집합- 수평 결합을 해주는 JOIN과 달리 위 아래로 데이터를 수직 결합을 해주는 기능- 컬럼의 수와 데이터 타입이 동일해야 수행 가능 - UNION ALL이 정렬이 들어가지 않기 때문에 더 빠르고 가성비가 좋다고 함- UNION은 정렬 후 중복 제거를 하는 과정 중, using temporary를 하는데 임시  저장소에 담았다는 것이다. 이 과정이 성능상 좋지 않다고 한다. ⭐ UNION- 두 개 이상의 SELECT 문의 결과를 결합하는 데 사용- 중복 행은 하나로 간주(중복 행 제거)SELECT AFROM BWHERE UNIONSELECT AFROM CWHERE ⭐ UNION ALL- UNION과 거의 동일하지만 중복 행을 제거 하지 않음SELECT AFRO..
·📓 Week I Learn
📓 배우고 해낸 것데이터 리터러시 강의 완강파이썬 종합반 강의 완강SQL  코드카타 70번까지 풀기SQL 스터디와 아티클 스터디 👍🏻 칭찬할 점새로운 팀원들과 시작한 SQL 스터디를 통해 좀 더 지식들을 향상 시킨 점SQL 코드카타 문제를 꾸준히 풀어낸 것그래도 심리적으로 파이썬에 대한 내적 친밀도가 나아진 점나름 잘 버텨내고 있는 점..? ㅠㅠㅋㅋㅋㅋㅋ 👎🏻 개선할 점생각보다 난이도가 있는 코드카타 문제에서는 깊게 생각해서 문제를 푸는 것이 아직은 미숙한 점때려넣기 방식으로 학습한 것 때문에 몇몇 정보들이 잘 정리가 안되어 있는 점파이썬 스킬업나의 분야에서 데이터 분석을 어떤 식으로 이용해 먹을 수 있는 지에 대한 사례 조사와 조언 구하기(동기부여가 점점 떨어지는 것 같아서 학습하다가 가끔 힘..
2024.07.05 ✳️ 결론 도출⭐ 결과와 결의 차이✔️ 결과- 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력 - 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음- 계산과 분석을 해서 나온 결과물 ✔️ 결론- 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰 - 데이터에 기반한 해석, 추론 또는 권고 사항을 포함- 목적에 대해 어떤 의미가 있는지 설명하는 것 결론을 도출할 때는 스토리텔링이 중요! (결과 - 결론)하지만 필요 이상으로 자신의 해석을 넣으면 안된당! 데이터를 통한 객관성이 필요! ⭐ 결론을 잘 정리하는 법1️⃣ 단순하고 쉽게 전달2️⃣ 흥미 유발3️⃣ 대상자 관점에서의 접근4️⃣ 시각화 팁 ☑️ 결론 보고서에 쓰면 좋은 플로우 ✔️ 전체 내용을 한 문장으로 정..
2024.07.04강의 들을 것도 많고.. 스터디 할 것도 있어서 뒤늦게 적는 강의 내용 정리 해본당 ㅎ ✳️ 지표특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보 제공정의한 문제에 대해 정확하게 파악하기 위해 필요  문제 정의 & 지표 설정문제 정의 = '어떤 문제를 풀고자 하는가?'를 정의지표 설정 = '어떤 결과를 기대하는가?'에 대한 정령화된 기준!  ✳️ 주요 지표 유형1. Active User (활성유저)- 활성 유저는 서비스에 들어오는 모든 유저를 말하진 않는다.- 활성 유저의 정의에 따라 전략과 방향이 달라진다.- 활성 유저에 대한 정의로 '이탈 유저'가 정의 된다.- 투자를 위한 서비스 지표에 중요한 역할을 한다.  2. ..
se0ehe
se0ehe