분류 전체보기231 데이터분석 1 url = 'https://raw.githubusercontent.com/justmarkham/DAT8/master/data/drinks.csv' drink_df = pd.read_csv(url, ',') 판다스로 csv파일을 읽으면 df형식으로 반환됨 drink_df.head() 상위 5개 보여줌 drink_df.tail() 하위 5개 보여줌 type(drink_df) // 타입 확인 drink_df.sample(10) // 랜덤 10개 보여줌 df.index 인덱스 확인 # 각 컬럼의 타입 출력 drink_df.dtypes 타입을 출력해서 각 컬럼의 정보를 알아내야한다. 꼭 필요한 작업이다. # 데이터프레임의 행과 열의 개수 출력 drink_df.shape 행과 열의 개수를 출력한다. (행, 열) c.. 2021. 7. 21. 프로젝트 근황 이제 알고리즘이랑 지도그리고 api만 쏴주면 끝난다. 얼마 안남았다. 혼자하는 감이 매우 크긴한데 그냥 열심히 하자. 2021. 7. 21. sql 문법 정리3 select * from point_users left join users on point_users.user_id = users.user_id 레프트 조인 select * from users u inner join point_users p on u.user_id = p.user_id; 이너조인// 집합으로 보면 편함. select u.name, count(u.name) as count_name from orders o inner join users u on o.user_id = u.user_id where u.email like '%naver.com' group by u.name 위 쿼리가 실행되는 순서: from → join → where → group by → select 서브쿼리 select * .. 2021. 7. 21. sql 문법정리 2 select name, count(*) from users group by name; 이렇게 name필드를 그룹으로 묶어서 카운트를 한다. 위 쿼리가 실행되는 순서: from → group by → select select * from users where name = "신**"; select name, count(*) from users group by name; //users 테이블에서 '신' 씨를 가진 데이터만 불러와서 개수 select 범주가 담긴 필드명, sum(합계를 알고 싶은 필드명) from 테이블명 group by 범주가 담긴 필드명; select 범주가 담긴 필드명, avg(평균값을 알고 싶은 필드명) from 테이블명 group by 범주가 담긴 필드명; select 범주가 담긴 필드.. 2021. 7. 21. 이전 1 ··· 54 55 56 57 58 다음