▼ map과 apply에 대한 개념 정리https://se0ehe.tistory.com/121 [Pandas] map, apply, applymap - (2.2.2 version)map과 apply의 큰 차이.. 바로 map은 시리즈에서만, apply 시리즈와 데이터프레임에 모두 활용해볼 수 있다는 점이었는데.. 막상 해보니까 아니 map도 데이터프레임에서 되는디요..? 해서 팀원분과 함se0ehe.tistory.com 🔒 56번) 데이터를 로드하고 데이터 행과 열의 개수를 출력하라url = 'https://raw.githubusercontent.com/Datamanim/pandas/main/BankChurnersUp.csv'🔓 해결 방법import pandas as pdurl = 'https:/..
📒 Today I Learn/🐼 Pandas
✳️ Pandas구조화된 데이터를 효과적으로 처리하고 저장할 수 있는 파이썬 라이브러리대용량 데이터 처리가 가능 : Pandas는 데이터를 메모리에 로드하고, 다양한 연산을 빠른 처리가 가능하며 대용량 데이터를 처리하는데 최적화.데이터 조작 기능 : 데이터 정렬, 필터링, 집계, 결측값 처리 등 데이터를 쉽게 가공할 수 있음데이터 시각화 기능 제공 : Matplotlib, Seaborn , … , etc데이터를 구조화하여 분석 가능 : DataFrame이라는 자료형을 제공하여 데이터를 표 형태로 나타내어 분석이 가능 ⭐ 데이터 다룰 때... Excel보다 Pandas?1. 자동화와 프로그래밍 기능Pandas는 다양한 라이브러리를 사용하여 데이터를 불러오고, 변환하며, 분석할 수 있다. 이를 통해 반복적..
2024.07.15오늘도 판다스를 이용한 빅분기 문제풀이를 하며 다양한 method와 모듈 이용을 공부하였당 🔒 31번) df의 new_price 컬럼 값에 따라 내림차순으로 정리하고 index를 초기화 해라내림차순 저번에 했던거 써먹기~🔓 해결 방법df.sort_values('new_price', ascending=False).reset_index(drop=True)ascending=True 가 디폴트 값이라 오름차순은 굳이 입력을 해주지 않아도 되지만, 내림차순은 False로 표시를 해줘야 한다. 🔒 32번) df의 item_name 컬럼 값이 Steak Salad 또는 Bowl 인 데이터를 인덱싱하라Steak Salad or Bowl인 데이터 출력하기🔓 해결 방법df.loc[(df[..
2024.07.12 🔒 20번) 데이터를 로드하라DataUrl : 'https://raw.githubusercontent.com/Datamanim/pandas/main/chipo.csv'🔓 해결 방법import pandas as pddf = pd.read_csv('https://raw.githubusercontent.com/Datamanim/pandas/main/chipo.csv')df 🔒 21번) quantity 컬럼 값이 3인 데이터를 추출하고 첫 5행을 출력하라quantity 컬럼 중에 값이 3인 데이터들만 추출, 그리고 위에서부터 5행만 출력🔓 해결 방법df[df['quantity'] == 3].head(5)df['quantity'] == 3먼저 요것의 뜻은.. 데이터 값이 3인 ..
2024.07.11오늘도 판다스 모듈을 사용해보면서 여러가지 method를 사용하는 연습을 해봤당..판다스 참 좋더라... 🔒 7번) 데이터셋의 인덱스 구성은 어떻게 되는가?인덱스 구성을 구하라는 말이 조금 이상하지만.. 앞에 라벨링처럼 되어있는 인덱스의 번호와 간격을 구하라는 것 같다. 🔓 해결 방법먼저 데이터셋을 전부 불러와 보면 맨 앞 줄에 굵은 글씨로 된게 인덱스!df.index().index( ) 를 사용하면 전체 데이터의 index의 시작부터 끝 번호와 간격의 범위를 알려준다. 🧐 그렇다면 특정 컬럼의 데이터 값으로 정렬해서 데이터를 재구성하면 index 구성이 어떻게 될까!# 'gameDuration'이라는 컬럼으 값으로 정렬을 해보았다.df.sort_values('gameDurat..
2024.07.10오늘은 아래 사이트에서 아주 초반 부분을 다뤄보며 스터디를 하기로 했기 때문에 풀어본 순서대로 적어보았다.나는 데이터 전처리 100문제 content 1번 getting & knowing data 의 1번 ~ 5번을 풀기로 배정 받았다. 나머지도 차차 해볼 예정이다.https://www.datamanim.com/dataset/99_pandas/pandasMain.html#getting-knowing-data 판다스 연습 튜토리얼 — DataManimQuestion 43 df의 데이터 중 new_price값이 lst에 해당하는 경우의 데이터 프레임을 구하고 그 갯수를 출력하라 lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98]www.dat..