HeYStRanGeR
article thumbnail

 

(2022.03.11)

데이터베이스 수업 들으면서 정리하기 1탄

1주차(3/8 강의 내용)

 


 

정리할 내용 목차

- 데이터와 정보의 개념과 차이

- 데이터베이스의 필요성

- 정보시스템의 개념과 발전과정

- 데이터베이스 정의, 특징, 분류

 


 

 

데이터와 정보의 개념과 차이 & 데이터베이스의 필요성

 

Data는 현실세계에서 관찰, 수집한 결과로 나타는 사실(fact)를 의미한다.

Informationdata를 가공,처리하여 의사결정에 활용하도록 체계적으로 조직한 결과물을 말한다.

 

- data는 information에 비해 상대적으로 쉽게 획득된다.

- information은 가공처리된 data로 정보시스템을 이용하여 특별한 노력을 통해서 획득된다.

--->data를 가공,처리하는 과정에서 다양한 information system이 활용된다. 

 

information system

 

information system (정보시스템): 한 조직의 운영/활동에 필요한 data를 수집/저장하고, 다양한 방식으로 처리/가공하여 의사결정에 필요한 information을 생성하는 소프트웨어 체계

information processing (정보처리): data에서 information을 추출하는 과정

 

--> 생성된 information은 또 다시 information system을 통해 입력 data로 활용되기도 한다. (관점에 따라 다르게 보임)

--> information system에는 가공 이전의 data와 가공 이후의 information 에 대한 저장소가 반드시 필요하다. 그래서 나온 것이 바로 database 이다.

--> database는 information system안에서 data를 저장하고 있다가 필요할 때 제공하는 역할을 담당한다.

 


 

Information system 의 발전과정

 

1. 전통적인 information system

  • 데이터 종속성이 높다 (data dependency) : 파일 접근방법/저장방식 변경 시, 연관된 모든 응용 프로그램을 함께 수정해야한다.

 

 

2. 개선된 information system (개선1)

  •  공통된 파일 관리 시스템이 만들어졌다.
  •  but, 데이터 중복성이 높다 (data redundancy): 같은 데이터가 여러 파일에 저장되어 관리가 어렵고, 저장소가 낭비된다.

 

 

3. 개선된 information system (개선2)

  •  데이터 중복성 문제가 조금 해결되었으나 파일 단위 동시 공유와 보안만 가능하다는 문제가 남았다.
  •  다수의 사용자 지원을 제한한다.
  •  대용량 데이터에 대한 공유, 보안, 장애 발생시 회복 등에 대한 처리가 어렵다.

 

 

4. 대망의 database system 등장

 

  •  데이터 종속성 문제 --> 공통의 데이터 모델과 표준 데이터 언어를 이용하여 해결
  •  데이터 중복성 문제 --> 통합 저장소를 이용하여 해결
  • database 접근을 DBMS가 제공 (복잡하고 힘든일은 DBMS가 모두 처리)
  • database system은 데이터의 검색과 변경 작업을 주로 수행한다. (변경작업: 삽입, 삭제, 수정)

 

출처: 교수님 강의노트


 

DATABASE

 

 

database의 넓은 의미:  데이터의 형식/구성에 제약없이 자유롭게 활용하는 사용자 관점에서의 데이터베이스

database의 좁은 의미:  데이터 형식이나 구성에 엄격한 제약을 갖는 시스템 관점에서의 데이터베이스

 

database: 특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장운영데이터의 집합

1) 공유데이터 shared  --> 혼자 사용할 목적 x, 공동으로 사용할 목적

2) 통합데이터 integrated  --> 논리적 통합 (흩어져있어도 상호연결되는)

3) 저장데이터 stored --> 0, 1 이진 문자열로 표현되는 디지털화된 저장데이터

4) 운영데이터 operational

 

database 특징

1) real-time accessibiltiy (실시간 접근)

2) continuous evolution (계속 변화)

3) concurrent sharing (동시 공유)

4) conent reference (내용기반 참조)

 

data 분류

1) 정형 데이터 structured : 구조화된 데이터 (엑셀 스프레드시트, 관계데이터베이스의 테이블 등)

2) 반정형 데이터 semi-structured : 구조에 따라 저장된 데이터 근데 데이터 내용에 구조에 대한 설명이 포함됨, 구조파악 parsing 필요 (HTML, JSON 파일 등)

3) 비정형 데이터 unstructuerd: 정해진 구조 없이 저장된 데이터 (쇼셜미디어의 텍스트, 영상 등)

 

 

728x90
profile

HeYStRanGeR

@HeYStRanGeR

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!