[오전]
빅데이터는 Small Data를 계속 저장하여 실시간으로
데이터를 처리하고 처리된 데이터를
더 빠르고 쉽게 분석하도록 하여, 이를 필요한 자료(정보)를 뽑아내는 것이라고만 생각했음.
하지만 여기에 더해, 빅데이터라는 Theme가
만들어지게 된 계기는 우선 저장 기술이 비약적으로 발달했기 때문이라는 점부터 시작.
< SQL DataBase & No SQL Data Base
& Distributed File System >
SQL DataBase ( RDBMS )
: RDBMS에서 R은
Relational! 표 형식, 약간 엑셀 같은 느낌의 테이블에
저장하는 것.
장점이 아직도 많기는 하지만, 시대가 변함에 따라 새로운 요구(동적 데이터)를 처리하기엔
문제가 있음
No SQL Data Base
: SQL Database의 여집합.
데이터 간의 관계를 정의하지 않는다. 데이터 테이블은 그냥 하나의 테이블이며 각 테이블
간의 관계를 정의하지도 않음. SQL문을 던지는 형식도 자유로운 것 같음.
어떠한 데이터라도 저장가능하고 찾기도 쉬운 Hashing 개념의 데이터
저장 방법을 지원하는 것 같음.
Distributed File System
: Hadoop -> 분산 파일 시스템 중에서 가장 괜찮은 분석
솔루션
인터넷 서비스를 위해 대용량 데이터를 대규모 저가 노드 기반
클러스터 시스템에
분산 관리하는 오픈 소스 기술
왜 이렇게 다양한 저장방법이 생기고 발전하게 되었는가?
=> RDBMS는 비싸다. H/W
,S/W 둘 다 비싸다. 그런데 이렇게 고가의 고성능 저장장치에 카톡.txt 파일을 저장하고 있으면 사용하는 회사입장에서는 적자. 그렇기
때문에 Hadoop 같은 적당한 규모와 성능의 분산 파일 시스템을 개발하게 되는 것.
No SQL DB 또한 마찬가지 -
웹서비스, SNS, SNG 등으로 인한 데이터 폭증, RDBMS의
고비용,
웹 어플리케이션 특징(Without transactions, Without
strong consistency, Non-structured data) 을 만족 시키기 위한 저장 방법이 필요했기 때문!
[오후]
<Database & DBMS>
Database는 DBMS로부터
만들어진 데이터 저장소.
DBMS는 그 데이터베이스를 관리하는 S/W 솔루션
수업시간에는 Database를 ~.doc
, DBMS를 MS-Word로 비유해서 설명하였음.
따라서 오라클을 배우게 되면 word로 우리가 필요한 Text정보들을 관리하듯이,
오라클 S/W로 다른 정보들을 관리 가능함.
<login.sql & ic.bat 작성>
현재 세션만이 아닌 다음 sqlplus사용시에도 변경된 파라미터의
속성,환경변수 설정등을 유지하고 싶은 경우 login.sql파일을
작성. SQL plus를 실행시키는 디렉토리에 존재해야 함
ic.bat은 접속명령을 담아 놓은 batch파일! 명령어 ic 입력만으로도 sqlPlus 접속가능!
set path=C:\~~\instantclient-11.1;%path%
sqlplus id/pw@ip:1521/DB이름
sqlplus id/pw@ip:1521/DB이름
C:\Documents and Settings\user> ic