'튜닝' 태그의 글 목록

728x90

MS-SQL Server 2008 부터 지원되는 데이터 압축 기능

•압축방식
–행압축
•고정길이데이터형식을가변길이데이터형식처럼저장
•행메타데이터최적화
–페이지압축

•행압축
•접두사및사전

데이터를 압축하여 보관 하게 되므로 아래와 같은 장단점이 있다

•장점
–물리적인저장공간감소
–메모리내데이터압축
–동일한쿼리의결과반환을위해더적은데이터페이지를참조하므로I/O가감소됨
–어플리케이션수정필요없음

•단점
–CPU 자원사용률이증가함

압축 전후의 차이는 CPU 사용율이 증가하나 Query속도는 비슷하다.

DW 또는대용량데이터마트의경우CPU 자원에여유가있으면페이지압축검토

행압축이데이터공간을절약하고,CPU 사용률이10% 정도증가할경우행압축검토

•인덱스재작성시평균CPU 자원사용량
–행압축: 약1.5배필요
–페이지압축: 약2~5배필요

(실제 구현)

http://msdn.microsoft.com/ko-kr/library/cc280449.aspx

(펌 자료)

SQL Server 2008(Enterprise Edition)에서는 테이블 및 인덱스 모두에 대해 행 압축과 페이지 압축을 지원합니다.

１ 행 압축
행 압축을 사용하면 데이터 형식과 연결된 데이터의 물리적 저장소 형식이 변경됩니다. 예를 들어 테이블에 데이터 형식을 BIGINT 를 사용했다고 가정한고 값이 10이 입력되었다고 하면 행 압축을 하면 10을 저장하기 위해서 BIGINT 데이터 형식으 크기 8 바이트가 아니라 값을 기준으로 필요한 바이트 즉 1바이트만 사용하게 됩니다.

２ 페이지 압축
페이지 압축은 테이블, 테이블 파티션, 인덱스 및 인덱스 파티션에 대한 압축과 유사합니다. 페이지 압축을 사용할 경우 인덱스의 리프 수준이 아닌 페이지는 행 압축만 사용하여 압축됩니다. 테이블 및 인덱스의 리프수준을 압축은 접두사 압축 후 사전 압축 작업을 진행하여 압축을 합니다.

가) 접두사 압축

접두사 압축을 진행하면 접두사는 헤더로 이동하고 열 값은 접두사의 참조로 변경됩니다.

접두사 압축전 테이블 페이지	접두사 압축 후 테이블 페이지

나) 사전 압축

사전 압축은 페이지에서 반복된 값을 검색하여 CI 영역에 저장합니다.

접두사 압축 후 테이블 페이지

사전 압축 후 테이블 페이지

페이지 압축은 데이터가 첫 데이터 페이지에 추가되는 시점에 데이터의 행이 압축됩니다. 페이지가 가득 차지 않으면 페이지 압축으로 얻는 이득이 없어 행이 가륵 차면 추가할 다음 행에서 페이지 압축 작업을 시작합니다. 그리고 압축하기 전에 페이지 압축으로 얻는 공간에서CI 구조에 필요한 공간을 뺸 값이 크지 않으면 해당 페이지에 대한 페이지 압축을 하지 않습니다.

3 압축된 테이블 쿼리

가) 테이블 생성

CREATE TABLE T1

(c1 int, c2 nvarchar(1024) )

WITH (DATA_COMPRESSION = PAGE | ROW);

나) 테이블 변경

ALTER TABLE T1
REBUILD WITH (DATA_COMPRESSION = PAGE | ROW);

4

성능 테스트
가) 개요

① 샘플 데이터 1000만 건에 대해서 압축안함, 행 압축, 페이지 압축에 대해서 데이터 크기 및 Select 쿼리 성능 및 Insert 쿼리 성능 측정

나) 데이터 크기

데이터 사이즈는 테이블 구조에 따라 틀리겠지만 Page 압축을 했을떄 48%, Row 압축시77%의 압축율을 보입니다.

가) Select 쿼리 성능

Page

압축의 경우 압축안함과 비교하여 CPU는 118%로 조금 더 사용하지만 Reads 에서
208% Duaraion에서 155%의 쿼리 성능이 향상 된다.

나) 대량 데이터 Insert 쿼리 성능

단일 데이터 입력은 거의 성능차이가 없기떄문에 대량 데이터 입력으로 쿼리 성능을 측정하였습니다. 대량 데이터 입력(백만건)시 Page 압축은 압축 안함과 비교하여 CPU 자원을 압 235%로 자원을 더 사용하며 Duration 또한 249% 더 증가한다. Write 의 경우는 압축율에 비래하여 50% 정도로 감소한다.

5 결론

테이블 압축을 사용을 하면서 데이터 공간의 절약을 할 수 있으며 또한 데이터 조회시 압축을 함으로써 압축을 복원하는데 CPU 자원을 약간 더 사용을 하지만 Reads 및 Duration 에 많은 성능 이점을 가지고 있습니다. 대량 데이터 Insert 시점에는 다소 성능이 떨어집니다. OLTP 환경에서 데이터 건수가 많고 조회가 많은 테이블에 대해서는 테이블 압축을 적용하면 많은 이점을 얻을 수 있을거라 판단됩니다. 또한 OLAP 환경에서도 대량 데이터를 입력하는 Insert 쿼리는 다소 떨어지지만 저장공간 및 집계 및 조회 성능 이점이 많을거라 판단됩니다.

[출처] MS-SQL 2008 데이터 압축기능 |작성자 야생곰탱

저작자표시

'데이터베이스 > SQL Server' 카테고리의 다른 글

MS-SQL의 osql.exe 이용 하기 (도스상에서 sql 구문 이용) (0)	2012.07.04
SET NOCOUNT (0)	2012.06.26
[MSSQL2008] 테이블을 다시 만들어야 하는 변경 내용 저장 사용 안 함 (0)	2012.04.20
DB 테이블 ROW갯수 한번에 보기 (0)	2010.08.16
테이블의 컬럼의 설명정보 보기 (0)	2010.08.16

728x90

유닉스

cpu : sar, vmstat, mpstat, iostat

mem: sar, vmstat

disk : sar, iostat

net : netstat

방법:

1. 유저로 부터 솔직한 피트백을 얻는다 “ 예전 퍼포먼스가 좋게 나온 이후로 어떤 것을 변경했는가?”

튜닝의 범위, 순서, 목표을 설정한다.

문제 정의 :

튜닝 목표 설정

문제 범위 설정(전체 인스턴스 문제인지 아니면 특별한 app인지

싱글유저인지 특별한 작업인지)

문제 시간 설정

피크 타임인지 아니면 다른 시간대인지

2. os, db, application 의 모든 통계정보를 얻는다.

3 . os를 체크한다. 하드웨어나 os 상의 에러가 없는지 체크한다.

os 상의 다른것이 리소스를 점유하지 않는지 확인

os 체크 방법

시스템 전체에서 유저들이 차지하고 있는 cpu 사용률 과 커널이 점유하는 cpu 사용률을 체크

각 cpu 당 유저들이 차지하고 있는 cpu 사용률 과 커널이 점유하는 cpu 사용률을 체크

시스템에서 메모리 페이징이나 수와핑이 절대로 일어나지 않게 메모리 증설

장비들 간의 네크워크 속도를 체크

큐가 차 있거나 reponse가 늦은 디스크를 찾아낸다.

하드웨어 에러가 하나도 없는 것을 확인한다

CPU 사용률, DISK, MEMORY 사용률, NETWORK 성능

4. oracle top 10 체크

1 매번 커넥션 -미들웨어가 지속적인 커넥션을 못가져감

2 잘못된 커져오 shared pool 사용

커져가 없으면 계속 파싱됨. 그리고 바인드 변수가 없어도 마찬가지.

3. db의 i/o 구성도를 확인

4. 너무 작지않은 크기의 리두로그 5개 정도.

5. 버퍼캐시에서 시리얼한 데이타 블럭은 free lists, free list groups, initrans 부족 초래.

6 full table scan 을 피하게 모델링 한다.

7 disk sort 를 피한다.

8 많은 양의 recursive sql( sys가 만든)것은 공간 할당하는 게 많고 이런것들은 성능 저하초래

sql이나 plsql 이 발생시킨 것들은 실행자 가 다른 유저 id로 나타나는데 이런것 들은 상관 없음

9 완전하지 않게 개발된 db나 잘못된 통계가 성능저하를 초래 <-- 통계 주기적 갱신

10 ...

5. 퍼포먼스에 문제를 일으키는 어떤 실마리를 찾았다고 생각하면 개략적인 모델을 작성한다. (이 항목은 엔지니어 경험을 계속적으로 append 해 나감)

---싱글 유저일때 response time/ batch run time 이 제대로 나오지 않으면 app(sql 스크립트)가 잘못 디자인 된 것이다.

이럴땐 app의 internal 통계를 얻는다 (sql trace, sql plan)

계발자와 함께 데이터, 인덱스, sql, 모델링, 등을 검사한다.

---모든 cpu가 잘 활용되는지 조사

커널 사용율이 40% 이상이면 db인전의 os를 조사한다. ( 네트워크 transfer, paging, process thrashing)

그렇지 않으면 유저당 cpu 사용율을 조사한다.

그 외의 다른 프로세스가 cpu을 점유하고 있는지 조사

오라클 9i 에서는 cpu 통계를 제공 (v$sql

---- 모든 cpu가 잘 활용되지 않고 있다면 시리얼한 작업을 하고 있는지 확인

wait_events 확인 하면 알수 있음 <--큰 것 한나 잡아내서 sql 스크립트 정정 및 db 파라미터 수정

시리얼 한게 없다면 문제는 db밖의 것이다.

6. 모델을 검토해서 시스템에대해서 추천할수 있는 변경사항들과 해서는 안될 사항들을 제안하고

한번에 하나의 항목을 변경해서 상태를 모니터링 해야함

7 기대한 성능이 나오면 그것으로 모든것을 완료하고 그렇지 않으면 다른 bottleneck을 찿아본다.

8 . 5 6 7을 반복한다.

=================================================================

비상사태시 대처방안

1. 유저로 부터 솔직한 피트백을 얻는다 “ 예전 퍼포먼스가 좋게 나온 이후로 어떤 것을 변경했는가?”

2. CPU 사용률, DISK, MEMORY 사용률, NETWORK 성능

3. 많은 CPU 사용율을 가지는 세션을 조사

4 Many buffer gets 를 하는 세션이나 sql 문을 조사 V$SESSTAT, V$SQL

5. 실행 계획 변경은 다른 서브 실행 계획들에 영향을 준다.

6 잘못된 파라미터 변경

7. 코드 변경에 따른 알고리즘적 이슈 확인

튜닝 대상

application

oracle

system (os & hardware)

튜닝 타입

1. 사전 모니터링

( 주기적으로 한다. – 퍼포먼스 플래닝의 일부분으로 해석)

퍼포먼스 통계와 시스템 리소스 사용통계등을 수집해서 변화가 있었는지 확인)

모니터링 시에는 configure 변경같은 것을 될수 있으면 하지 않는다. (심각한 문제가 발생된다면 고려해 볼일이고 그렇지 않으면 체계적으로 튜닝 순서에 맞게 계획을 세운후 한다.)

정상적으로 동작하는 시스템에 아주 조그마한 튜닝 작업도 때때로 심각한 성능저하를 초래할 수 있다는 것을 명심해라.)

2. bottleneck 제거

보통 튜닝은 문제점을 고치는 과정이지만 최종단계가 아님. 이것은 시스템이 설계되고(design) , coding, production, maintenance 과정의 일부분이어야 한다.

----------------------------------------------------------

cpu부터 네트워크 까지는 “host 검사” 이다

cpu

cpu usage

idle 상태가 많으면 -> i/o 일 것이다. wail i/o--> idle cpu

사용률이 높으면 -> cpu가 효율적으로 사용되는지 확인 (

1개의 cpu 사용률이 높으면 ->높은 cpu 사용률을 가진 몇개의 프로그램 때 문은 아닌가?

cpu 사용률이 균일하게 분산되었는게

몇개의 오라클 프로셍서가 많은 cpu를 차지한다면 sql_trace, tkprof를 돌린다.

(단 select 문이 캐쉬 데이터를 많이 읽을경우 cpu가 높게 올라가고 이런문장은 튜닝 할 필요가 없다)

v$sysstat -> 모든 세션에 대한 cpu usage

여기서 “cpu used by this session” 은 모든 세션에서 사용된 cpu 총량을 나타냄

v$sesstat -> 여기서 “cpu used by this session” 은 각 세션별로 사용된 cpu 총량을 나타냄

i/o

disk queue lengths가 2보다 클때 혹은 disk service time 이 20 ~ 30 ms 이상일때

os 툴 --> sar -d , iostat

어떤 프로세스가 어떤 disk (file)를 잡고 있는지 –아마 오라클 파일이 아닐수도 있다

오라클의 wait event 인 v$system_event 를 살펴서 i/o와 관련된 이벤트 확인

'데이터베이스 > 오라클' 카테고리의 다른 글

Protected: Presentation Scripts (0)	2010.09.29
Oracle DBA Scripts and Tips (0)	2010.09.28
소계 & 총계 구하는 SQL (ROLLUP) (0)	2010.08.16
오라클 NLS_LANG 설정변경 (0)	2010.08.16
Oracle 시스템정보보기 관련 쿼리 (0)	2010.08.16

728x90

MSSQL이 쿼리 컴파일 부하를 줄이려고 노력한 것이
상당히 귀찮은 일들을 불러들이는군요.
캐시 오브젝트는 최근 실행순으로 정렬됩니다.
아래 URL에서 코드를 정리했습니다.

http://www.microsoft.com/technet/scriptcenter/scripts/sql/sql2005/perf/sql05vb023.mspx

SELECT
  qs.last_execution_time
, qs.creation_time
, SUBSTRING
  ( sqltxt.text
  , qs.statement_start_offset / 2 + 1
  , ( CASE
        WHEN qs.statement_end_offset = -1 THEN LEN(CONVERT(NVARCHAR(MAX), sqltxt.text)) * 2
        ELSE qs.statement_end_offset
      END
      - qs.statement_start_offset
    ) / 2 + 1
  ) "cropped_text"
, qs.execution_count        , sqlplan.query_plan        , qs.plan_generation_num
, qs.total_worker_time      , qs.last_worker_time       , qs.min_worker_time        , qs.max_worker_time
, qs.total_physical_reads   , qs.last_physical_reads    , qs.min_physical_reads     , qs.max_physical_reads
, qs.total_logical_writes   , qs.last_logical_writes    , qs.min_logical_writes     , qs.max_logical_writes
, qs.total_logical_reads    , qs.last_logical_reads     , qs.min_logical_reads      , qs.max_logical_reads
, qs.total_clr_time         , qs.last_clr_time          , qs.min_clr_time           , qs.max_clr_time
, qs.total_elapsed_time     , qs.last_elapsed_time      , qs.min_elapsed_time       , qs.max_elapsed_time
, sqlplan.encrypted         , qs.sql_handle             , qs.plan_handle            , sqltxt.text "raw_text"
FROM sys.dm_exec_query_stats qs
CROSS APPLY sys.dm_exec_sql_text(qs.sql_handle) sqltxt
CROSS APPLY sys.dm_exec_query_plan(qs.plan_handle) sqlplan
ORDER BY qs.last_execution_time DESC;

알 수 있는 정보

쿼리가 매개변수화 되었는가
플랜 확인
부하가 어느정도 되는가
재사용이 되는가

출처 : http://tsohr.tistory.com/279

저작자표시

'데이터베이스 > SQL Server' 카테고리의 다른 글

SSMS에서 자동으로 바꿔지는 한글 상태 문제 (0)	2010.04.28
프로시저 캐시의 특정 타입만(SQLCP) 초기화 시키자. (0)	2009.10.06
SQL Server 쿼리 성능 최적화 (0)	2009.04.13
SQL Server CPU 성능 최적화 (0)	2009.04.13
유용한 프로시저 (0)	2008.11.07

컴퓨토피아

튜닝

MS-SQL Server 2008 부터 지원되는 데이터 압축 기능

'데이터베이스 > SQL Server' 카테고리의 다른 글

오라클 튜닝 & 유지보수 관련정리

'데이터베이스 > 오라클' 카테고리의 다른 글

최근 Plan Cache Object 조회

'데이터베이스 > SQL Server' 카테고리의 다른 글

+ Recent posts

티스토리툴바