728x90
Database는 크게 두 가지 종류로 나뉜다.
RDBMS(SQL)
행/열의 생김새가 정해진 액셀에 데이터를 저장하는 것과 유사하다. 데이터 50만 개가 적재된 상태에서 갑자기 중간에 열을 하나 더하기는 어렵지만, 정형화되어 있는만큼 데이터가 일관적이고, 분석에 용이하다. MySQL, MSSQL이 여기에 속한다.
NoSQL
딕셔너리 형태로 데이터를 저장해두는 DB로 데이터 하나하나마다 같은 필드 값들을 가질 필요가 없어 자유로운 형태의 데이터 적재에 유리한 대신에 일관성이 부족할 수 있다. MongoDB가 이에 속한다.
MongoDB
다양한 플랫폼에서 사용할 수 있는 NoSQL 타입의 데이터베이스 프로그램으로 JSON과 비슷한 형태로 자료를 정리한다.
MongoDB의 자료는 각각의 딕셔너리인 도규먼트가 모여 컬렉션, 컬렉션이 모여 DB가 되는 형태이다. Web Scrapping 섹션에서 실습한 영화 정보를 예로 들면, 제목/순위/별정이 있는 각 영화 정보가 도큐먼트이고, 이 것들이 모인 컬렉션을 크롤링용 DB에 저장할 수 있다. 만약 네이버 기사 제목을 크롤링했다면 그 결과는 같은 DB에 다른 컬렉션으로 저장할 수 있겠다.
728x90
'컴퓨터 사이언스 > Database' 카테고리의 다른 글
왜 DB Index로 B tree 계열이 사용되는가? (1) | 2023.08.24 |
---|---|
MongDB 사용법 (0) | 2023.08.08 |
데이터베이스 설계 실습 - 스타벅스 홈페이지 (0) | 2023.06.25 |
데이터베이스 설계 실습 - 맥도날드 키오스크 (0) | 2023.06.25 |
정규화 (0) | 2023.06.25 |