본문 바로가기
IT

[TIL] kaggle 데이터 분석[와인]_15일차(DBeaver에 csv 파일 연동,kaggle에서 데이터 다운, 와인 데이터 오류 해결)

by 공부하죠 2024. 4. 16.
반응형

오늘 처음 kaggle에서 데이터를 가져오고 가져온 데이터를 DBeaver 에 연동시키는 방법을 배웠습니다.

정말 복잡하고 신경써야 할 부분이 많이서 인내심이 매우 필요한 하루네요.

오늘 kaggle 에서 가져온 데이터는 와인 정보 데이터(Wine Information) 입니다.


✍🏻학습 내용📚

1. DBeaver에 csv 파일 연동

2. kaggle에서 데이터 다운로드

 


1. DBeaver에 csv 파일 연동

1) DBeaver에 MySQL 을 설치하는 이유 :

그냥 csv파일을 DBeaver 업로드하면 csv파일에 있는 컴럼 형식들이 자동적으로 int 즉 123 형식으로 바꿔지 않고 문자 즉 ABC형식으로만 나타납니다.

그런데 이 파일에서 cast함수로 수정도 할 수 없어 반드시 MySQL 로 파일을 열어야지 오류가 안 나타납니다.

그래서 밑의 테이블처럼 나올려면 MySQL로 csv 파일을 파일 불러오기 해야합니다.

2) DBeaver에 csv 파일 연동하기 위해서는 먼저 MySQL Community 다운로드 받아야합니다.

No thanks, just start my download.를 클릭하고 next 또는 yes를 클릭하고 넘어가면 오른쪽에 빨간색으로 표시된 Add...을 클릭합니다.

다운로드가 완료되면 화면에 Next가 나옵니다. 그걸 클릭합니다.

그 다음 또 Next 클릭합니다.

그 다음 또 Next 클릭합니다.

Root의 비밀번호를 설정한 후 Add User을 클릭합니다. 그곳에 원하는 Add User 을 타이핑합니다.

절대 비밀번호는 잊지 마세요.

그 다음 OK 클릭합니다.

그 다음 Execute 클릭합니다.

아직 안 끝났습니다. 다음 화면에서 Next를 클릭합니다.

변경하지 않고 기본 설정으로 Finish를 클릭합니다.

그 후 계속 Next를 클릭합니다.

Execute를 클릭하고 다운로드 받고 Finish를 클릭하고 Next를 클릭하면 밑의 화면이 나옵니다.

그 다음 밑의 화면이 나오면 드디어 끝입니다. 이거 진짜 힘드네요.

제가 알려드린 순서와 조금 차이가 있을 수 있지만 기본적으로 이런 식으로 작동합니다.

그리고 절대 비밀번호는 잊지 마세요. 계속 씁니다. 이거 잊으면 다시 설치해야합니다. 🤣

이 작업이 다 끝났으면 DBeaver에 새 데이터베이스 연결(노란 형광펜) 클릭하고 MySQL 클릭 후 다음을 클릭합니다. 

MySQL에서 지정한 비밀번호 입력합니다. 그 후 완료 클릭합니다.

그럼 왼쪽에 localhost가 있습니다. 거기에 마우스 대고 마우스 우클릭하면 연결이 잘 되어있는지 안되는지 나옵니다.

오류가 뜨면 Edit connection에서 어떤 것이 잘못되었는지 찾습니다.

저는 노란 형광펜 부분을 클릭하고 밑의 화면처럼 false를 true로 바꾼 후 다시 연결해보니 잘 작동했습니다.


2. kaggle에서 데이터 다운로드

kaggle 에서 가져온 데이터는 와인 정보 데이터(Wine Information) 입니다.

여기에 다운로드 받으시면 zip파일을 받게 되고 압축 풀기하면 csv파일이 들어있습니다.

 

그래서 이 csv파일을 DBeaver에 데이터 가져오기 하면 됩니다.

아까 만든 localhost 밑에 데이터베이스(노란 형광펜) 를 마우스 우클릭하면 밑의 화면과 같은 카테고리(노란 형광펜) 클릭 후 이름을 작성하시고 확인 클릭합니다.

 

 

이 새로 생긴 곳에 파일을 불러오기(가져오기) 하면 됩니다.

 

⚠️주의 ⚠️

와인 데이터 파일이 오류 뜰 수 있으니 밑의 내용도 참고하세요!

Wine_info DB Import 순서

  1. 첨부된 Wine_info, cleansingwine 파일 다운로드
  2. DBeaver Localhost 데이터베이스에서 데이터 가져오기 실행
  3. 원하는 csv 파일 불러오기
  4. 이스케이프 문자를 \에서 \n으로 수정
  5. Sample rows count를 50,000으로 수정
  6. Tableau mapping 단계에서 local3의 데이터 타입을 varchar(255)로 수정
  7. 진행 후 완료

cleansingwine DB Import 순서

  1. 첨부된 cleansingwine 파일 다운로드
  2. DBeaver Localhost 데이터베이스에서 데이터 가져오기 실행
  3. 원하는 csv 파일 불러오기
  4. 이스케이프 문자를 \에서 \n으로 수정
  5. Sample rows count를 50,000으로 수정
  6. 진행 후 완료

정말 오늘 하루는 거의 이 프로그램 연결 작업에만 시간을 쓴거같아요;;🤣

그래도 지금은 작동이 잘 되서 너무 좋네요.😊 여러분들도 화이팅하세요!!

 

DBeaver 를 설치하는 방법을 알고싶다면 여기를 클릭💨

SQL를 기초부터 공부하고 싶다면 여기를 클릭💨

🌈 오늘도 행복한 하루되세요✨

 

반응형