728x90

인덱스 관리 개선기능

인덱스는 데이터베이스에 저장된 데이터에 좀 더 빠른 접근을 가능하게 하는 핵심 기능입니다.

하지만, 데이터베이스에 저장된 데이터가 변경됨에 따라 적절한 인덱스를 유지 보수하는 작업은

상당한 시간과 자원을 필요로 합니다. 데이터베이스 관리자가 인덱스를 생성, 변경, 삭제하는

방법을 이해하고 있어야 할 뿐만 아니라, 인덱스가 적절하게 사용될 수 있도록 조각화에 대한

대처 방법을 알고 있어야 합니다.

SQL Server 2005에서는 인덱스 관리측면에서 뛰어난 개선기능을 제공하며, 새로운 DDL 문장과

인덱스 관련 기능이 제공됩니다.


SQL Server 2005의 새로운 인덱스 관리 기능

SQL Server 2005에서도, SQL Server 2000과 마찬가지로 클러스터형 인덱스와 비클러스터형

인덱스를 제공합니다. 또한, 계산된 컬럼이나 뷰에 대해서도 인덱스를 생성할 수 있습니다.

하지만, SQL Server 2005에서는 인덱스를 생성하고 처리하는 방법에 대한 개선된 기능을

제공하고, 새로운 형식의 인덱스를 생성할 수 있습니다.

ALTER INDEX 구문
SQL Server 2005의 새로운 인덱스 관련 기능 중 하나는 ALTER INDEX T-SQL 구문에 대한

지원으로, 인덱스를 재생성하고, 재조직하고, 비활성화하고, 인덱스 관련 옵션을 조정하기

위해서 사용합니다. ALTER INDEX 구문을 사용하면, 인덱스의 조각모음을 위해 인덱스를

삭제하고 재 생성할 필요가 없어집니다. 또한, 이전 버전 SQL Server에서 사용하였던

DBCC 명령의 일부를 대체하게 됩니다.

온라인 인덱스 작업
SQL Server 2005에서는 인덱스가 사용중인 상태에서 인덱스에 대한 관리작업을 수행할 수

있기 때문에, 관리작업을 위한 부하가 최소화될 수 있습니다. 이전 버전 SQL Server에서는

인덱스에 대한 작업을 하는 동안 테이블과 인덱스에 대해서 배타적 잠금을 설정하였기

때문에, 인덱스 작업이 완료될 때까지는 해당 테이블에 차단현상이 발생하였습니다.

온라인 인덱스 작업을 수행하기 위해서는 해당 작업을 지원하기 위한 추가적인 디스크

공간이 필요합니다. CREATE INDEX, ALTER INDEX, DROP INDEX 명령을 실행할 때는,

해당작업을 온라인으로 작업할 것인지 여부를 지정해야 합니다.

병렬인덱스 작업
인덱스를 생성, 변경, 삭제하는 작업에는 정렬 및 스캔을 작업을 위해 여러 개의 CPU를

사용하여 병렬처리 작업을 수행하는 것이 효과적입니다. SQL Server 2005에서는 인덱스

작업에 대한 병렬처리가 자동으로 수행되며, 별도의 MAXDOP 옵션을 지정하여 병렬처리에

사용할 CPU 개수를 지정할 수 있습니다. CREATE INDEX, ATLER INDEX, DROP INDEX TSQL

명령을 수행할 때 MAXDOP 쿼리 힌트를 사용하여 해당 작업에 대한 병렬처리를 위해 사용

할 CPU 개수를 지정할 수 있습니다.

잠금옵션
SQL Server 2005에서는 인덱스를 사용할 때, 새로운 두 가지 잠금 옵션을 제공합니다. 두가지

잠금옵션은 동시에 활성화될 수 있습니다.

    ALLOW_PAGE_LOCKS
       ALLOW_PAGE_LOCK 옵션이 ON으로 설정되면, 테이블 잠금이나 페이지 잠금을 사용하여

       인덱스에 접근하도록 설정합니다. OFF로 설정되면, 페이지 잠금이 사용되지 않습니다.

    ALLOW_ROW_LOCKS
       ALLOW_ROW_LOCKS 옵션이 ON으로 설정되면, 테이블 잠금이나 행 단위 잠금을 사용하여

       인덱스에 접근하도록 설정합니다. OFF로 설정되면, 행 단위 잠금이 사용되지 않습니다.

인덱스에 포함되는 컬럼 지정
SQL Server 2005에 비클러스터형 인덱스에는 리프 노드에 인덱스 키가 아닌 데이터도 포함될

수 있습니다. 인덱스에 포함된 컬럼에 대한 접근이 필요한 쿼리가 커버된 쿼리로 실행될 수

있기 때문에 성능을 향상시킬 수 있지만, 해당 데이터를 관리하기 위한 별도의 추가적인

디스크 공간이 필요합니다. 인덱스에 포함된 컬럼은 이전 버전 SQL Server에서 사용하였던

커버된 인덱스의 기능을 대체하기 위해 사용됩니다.

인덱스에 포함되는 컬럼을 지정하는 기능의 부가효과로 인덱스 키에 대한 크기의 제약이

확장됩니다. SQL Server 2000에서는 인덱스 키값의 최대 크기가 900 바이트로 제한되어

있었습니다. SQL Server 2005의 인덱스에 포함된 컬럼기능을 사용하면, 인덱스의 리프

노드에, 최대 행 크기과 동일하게, 8060 바이트까지 저장할 수 있습니다.

분할 인덱스 (Partition)
분할 인덱스는 SQL Server 2005의 인덱스 관련 주요 개선 중 하나입니다. 분할 인덱스이란,

인덱스를 하나 이상으로 구성된 파일그룹에 분산하여 저장하는 기능입니다. 인덱스 분할은

주로 분할된 테이블에 생성됩니다. 분할 인덱스는 데이터를 여러 개의 파일에 분산시키기

때문에 성능을 향상시킬 수 있고, 경합현상을 줄여줄 수 있으며, IO 작업이 병렬로 처리될 수

있는 가능성을 높여주는 역할을 합니다.

분할 인덱스에 대한 좀 더 자세한 정보는 SQL Server 2005 온라인 도움말의“분할 테이블 및

인덱스의 개념”부분을 참조하십시오.

XML 인덱스
SQL Server 2005 에서는 XML 데이터형을 지원합니다. CREATE PRIMARY XML INDEX와 CREATE XML INDEX T-SQL 명령을 사용하여 XML 데이터형 컬럼에 XML 인덱스를 생성할 수

있습니다. XML 인덱스는 XML 데이터형 컬럼에 데이터가 변경되었을 때 부가적인 비용을

발생시키기는 하지만, XML 데이터에 대한 XQuery 작업의 성능을 극적으로 향상시켜 줍니다.

XML 인덱스에 대해서는 몇 가지 제약사항이 있습니다. XML 인덱스에 대한 좀 더 자세한

정보는 SQL Server 2005 온란인 도움말의“XML 데이터 유형 열의 인덱스”부분을 참조하십시오.


인덱스 생성

CREATE INDEX 명령에 대한 설명과 기능에 대해서 살펴보고, 각 기능을 설명하는 예제

문과 코드 예제를 소개합니다.

Create Index 구문
CREATE INDEX 명령은 인덱스를 생성하는 역할을 합니다. SQL Server 2005에서는 새로운

인덱스 관련 기능을 지원하기 위해 CREATE INDEX 구문에 대한 기능이 확장되었습니다.

새로운 인덱스 관련 기능을 사용하기 위해서, SQL Server Management Studio의 개체

탐색기의 새 인덱스 생성 대화상자를 사용할 수 있습니다.

[참고]
CREATE INDEX 명령에서 유지 관리 마법사에서 사용하는 PAD_INDEX, SORT_IN_TEMPdb, IGNORE_DUP_KEY, ONLINE 옵션도 지정하여 사용할 수 있습니다.


CREATE [UNIQUE][CLUSTERED | NONCLUSTERED] INDEX index_name
ON [{database_name.[schema_name]. | schema_name.}]
{table_or_view_name}(column [ASC | DESC][,...n])
[INCLUDE (column_name[,...n])]
[WITH(<relational_index_option>[,...n])]
[ON {partition_scheme_name(column_name[,...n])
| filegroup_name | DEFAULT}]
<relation_index_option>::=
{ PAD_INDEX = {ON | OFF}
| FILLFACTOR = fillfactor
| SORT_IN_TEMPDB = {ON | OFF}
| IGNORE_DUP_KEY = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF} | DROP_EXISTING = {ON | OFF}
| ONLINE = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}
| ALLOW_PAGE_LOCKS = {ON | OFF}
| MAXDOP = number_of_processors }


온라인 인덱스 작업
CREATE INDEX 구문의 WITH 절에 ONLINE=ON 옵션을 지정하면, 인덱스 생성작업을 다른 DML 작업과 병행해서 수행할 수 있습니다.

[참고]
xml, text, ntext, image, varchar(max), nvarchar(max), varbinary(max), filestream 데이터형이

사용된 테이블의 경우에는 온라인 인덱스 작업을 수행할 수 없습니다.


CREATE INDEX IX_Employee_ManagerID
ON HumanResources.Employee (ManagerID)
WITH (ONLINE=ON)

 

병렬처리수준 지정
기본값으로, 데이터베이스 엔진에서는 최대병렬처리수준(MAXDOP) 구성옵션의 값을

기준으로 인덱스를 생성하는 작업에서 사용할 최대 CPU 수를 결정하게 됩니다. 필요에 따라,

인덱스 작업과 병행하여 처리되는 다른 작업에 영향을 최소화하기 위해, 별도의 MAXDOP

옵션을 지정하여, 인덱스 작업에서 사용하는 CPU를 제한할 수 있습니다.

MAXDOP 옵션을 지정하면, 서버에 구성되어 있는 최대병렬처리수준(MAXDOP) 옵션값보다

우선하여 적용됩니다. MAXDOP =0이라고 지정하면, 현재 데이터베이스 엔진의 작업부하를

고려한 상태에서, 사용할 수 있는 전체 CPU를 인덱스 작업에 사용합니다.

[참고]
ONLINE 옵션과 함께, 인덱스 생성, 변경, 삭제 작업에만 적용되는 별도의 MAXDOP 옵션을

설정할 수 있습니다. 쿼리 최적화기에서는 해당 인덱스를 참조하는 쿼리를 최적화하기

위해서 기존에 설정된 최대병렬처리수준 (MAXDOP) 구성을 사용합니다.

CREATE INDEX IX_Employee_ManagerID
ON HumanResources.Employee (ManagerID)
WITH (ONLINE=ON, MAXDOP = 3)


인덱스에 포함할 컬럼 지정
인덱스 리프(leaf) 노드에 포함될 컬럼을 추가로 지정할 수 있습니다.
커버된 인덱스를 생성하기 위해, 예제와 같이, AddressLine1 컬럼과, AddressLine2 컬럼을 AddressID컬럼에 대한 인덱스에 추가할 수 있습니다. 하지만, 해당 테이블에 대한 INSERT, UPDATE, DELETE 작업을 수행할 때는, 인덱스에 중복된 데이터를 유지하기 위해 추가

오버헤드가 발생하게 됩니다.

text, ntext, image 데이터형 컬럼에 대해서는 사용할 수 없습니다.

CREATE INDEX IX_AddressDetails
ON Person.Address (AddressID)
INCLUDE (AddressLine1, AddressLine2)


인덱스 분할(Partition)
CREATE INDEX 명령에 파일그룹과 파티션 스키마를 지정하여 분할 인덱스를 정의할 수

있습니다.

인덱스가 설정된 테이블은 분할된 상태이고, 인덱스 분할을 지정하지 않은 상태라면, 해당

인덱스는 테이블이 사용하고 있는 파티션 스키마와 동일한 위치에 생성됩니다.

CREATE INDEX IX_CustomerDetails
ON Sales.Customer(CustomerID)
ON Sales.CustomerScheme(CustomerID)


XML 인덱스 생성
CREATE [PRIMARY] XML INDEX 명령을 사용하여 XML 인덱스를 생성할 수 있습니다.
테이블에 XML 인덱스를 생성하기 전에 해당 테이블에 반드시 클러스터형 인덱스를 생성해야 합니다. 부가(secondary) XML 인덱스를 생성하기 전에, 해당 XML 컬럼에 기본(primary)

XML 인덱스가 생성되어 있어야 합니다. XML 인덱스를 생성할 때는, ONLINE 옵션을 사용할

수 없습니다.

CREATE [PRIMARY] XML INDEX index_name
ON [{database_name.[schema_name]. | schema_name.}]table_name
(xml_column_name)
[ USING XML INDEX xml_index_name
[ FOR { VALUE | PATH } ]
[WITH(<xml_index_option>[,...n])]
<xml_index_option>::=
{ PAD_INDEX = {ON | OFF}
| FILLFACTOR = fillfactor
| SORT_IN_TEMPDB = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF}
| DROP_EXISTING = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}
| ALLOW_PAGE_LOCKS = {ON | OFF}
| MAXDOP = number_of_processors }


다음과 같은 구문으로 XML 인덱스를 생성할 수 있습니다.

CREATE PRIMARY
XML INDEX IXML_ContactAddContact
ON Person.Contact(AdditionalContactInfo)

인덱스 수정

ALTER INDEX 명령에 대한 설명과 기능에 대해서 살펴보고, 각 기능을 설명하는 예제 구문과

코드 예제를 소개합니다

ALTER INDEX 구문
ALTER INDEX 구문은 인덱스를 재생성하고, 재조직화하고, 비활성화하고, 인덱스 관련 옵션을 변경하기 위해서 사용합니다. SQL Server Management Studio의 개체 탐색기의 인덱스 속성

대화상자를 통해 인덱스에 대한 변경작업을 수행할 수 있습니다.

다음 표는 ALTER INDEX 명령을 사용하여 수행할 수 있는 각 작업에 대한 간략한 설명입니다.

키워드 설명
REBUILD

인덱스를 재생성하면, 테이블에 저장된 데이터의 내부구조에 따라 인덱스를 재정렬하게 되고, 인덱스가 사용하고 있는 디스크 공간을 축소하기 위하여,

인덱스를 삭제했다가 다시 생성합니다.

REORGANIZE 테이블에 저장된 데이터의 논리적인 순서에 따라 인덱스의 리프 페이지를 재정렬합니다.
DISABLE 해당 인덱스를 사용하지 못하도록 하기 위해서 특정 인덱스(클러스터형 인덱스도 포함)를 비활성화합니다.
SET

인덱스를 유지관리하고 접근방법을 지정하기 위해 사용되는 인덱스 옵션을

조정합니다.


ALTER INDEX 명령은 인덱스 분할 정보를 변경하거나, 해당 인덱스에 컬럼을 추가하거나

삭제하기 위해서는 사용할 수 없습니다. 이러한 작업을 수행하기 위해서는 CREATE INDEX

명령을 WITH DROP_EXISTING 옵션과 함께 사용해야 합니다.

 

ALTER INDEX {index_name | ALL}
ON [{database_name.[schema_name]. | schema_name.}]
{table_or_view_name}
{ REBUILD [WITH(<rebuild_index_option>[,...n])]
| REORGANIZE [ WITH( LOB_COMPACTION = {ON | OFF})]
| DISABLE
| SET (<set_index_option>[,...n]) }

<rebuild_index_option>::=
{ PAD_INDEX = {ON | OFF}
| FILLFACTOR = fillfactor
| SORT_IN_TEMPDB = {ON | OFF}
| IGNORE_DUP_KEY = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF}
| ONLINE = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}
| ALLOW_PAGE_LOCKS = {ON | OFF}
| MAXDOP = number_of_processors }

<set_index_option>::=
{ IGNORE_DUP_KEY = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}


인덱스 재생성
REBUILD 절을 통해, FILLFACTOR, PAD_INDEX, SORT_IN_TEMPDB, IGNORE_DUP_KEY, STATISTICS_NORECOMPUTE 등의 옵션을 지정하여 인덱스의 구조를 변경할 수 있습니다.

온라인 작업으로 크기가 큰 인덱스(128 익스텐트 이상의 인덱스)를 재생성하게 되면, 데이터

베이스 엔진은 해당 인덱스가 사용하고 있던 기존 디스크 공간을 할당해제하기 전에 새로운

디스크 공간을 할당한 다음, 인덱스관련 데이터를 복사한 다음 재정렬작업을 수행합니다.

반드시 인덱스 재생성 작업을 수행하기 전에는 해당 작업을 수행할 수 있을 만한 충분한

디스크 공간을 확보해 두어야 합니다.

[참고]
클러스터형 인덱스를 재성성한다고 해서 자동으로 모든 비클러스터형 인덱스가 재생성되지는 않습니다. 하지만, ALTER INDEX ALL … REBUILD … 명령을 사용하여 단일 작업으로 특정 테이블에 존재하는 모든 인덱스를 삭제하고 다시 생성할 수 있습니다.

 

REBUILD 절에 ONLINE=ON 옵션을 지정하면, 온라인 작업으로 인덱스에 대한 변경작업을 수행

할 수 있고, MAXDOP 옵션을 지정하면, 별도의 최대병렬처리정도를 지정할 수 있습니다.

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
REBUILD WITH (FILLFACTOR = 80)


인덱스 재조직화
인덱스를 재조직화하면, 인덱스를 사용하여 순차적인 행을 대량으로 스캔하는 작업을

수행하는 쿼리의 성능을 향상시킬 수 있습니다. 재조직화된 인덱스는 이미 할당되어 있는

동일한 인덱스 페이지를 재사용하게 되며, 인덱스 재조직화의 결과로 완전히 빈 상태가 된

페이지만 할당해제하게 됩니다. 또한, 인덱스 재조직화작업은 Tempdb에 추가적인 작업

공간을 필요로 하지 않게 되면, 모든 데이터는 기존 인덱스 페이지내에서 재분배됩니다.

REORGANIZE 절에 지정할 수 있는 유일한 옵션은 LOB_COMPACTION으로, 대량개체데이터(image, text, ntext, varchar(max), nvarchar(max), varbinary(max)형 데이터)도 재조직화하도록

설정합니다.

인덱스 재조직화작업은 항상 온라인으로 수행되기 때문에, 병행해서 수행되는 동시성 쿼리나 데이터 변경작업을 차단하지 않습니다. MAXDOP 옵션을 별도로 지정할 수 없으며, 서버에

설정된 최대병렬처리정도(MAXDOP) 옵션도 무시됩니다.

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
REORGANIZE WIT


인덱스 비활성화
쿼리 최적화기는 SQL 문장에 대한 실행계획을 수립할 때, 비활성화되어 있는 인덱스는

고려의 대상으로 포함시키지 않습니다. 비활성화되어 있는 인덱스에 대한 참조 힌트가 설정된 경우에는 쿼리 최적화기에서 오류를 발생시킵니다. 인덱스가 비활성화되면, 해당 인덱스에

연결된 모든 제약조건과 기본키 및 외래키 제약조건도 함께 비활성화됩니다.

데이터베이스 엔진은 비활성화된 인덱스를 유지보수하지 않습니다. ALTER INDEX…REBUILD… 명령이나 CREATE INDEX… WITH DROP_EXISTING 명령을 사용하여, 인덱스를 다시 활성화할

수 있습니다. ALTER TABLE 명령을 사용하여 비활성화된 제약조건도 반드시 활성화시켜

주어야 합니다.

[참고]
테이블에 대해 클러스터형 인덱스를 비활성화한 경우에는, 테이블이 OFFLINE 상태로

표시됩니다. 모든 어플리케이션에서는 해당 클러스터형 인덱스가 활성화될 때가지는

해당 테이블을 사용할 수 없습니다. 물론, SELECT 쿼리를 수행할 수도 없습니다.

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
DISABLE


인덱스 옵션 변경
SET 절을 사용하여 인덱스에 사용하는 ALLOW_ROW_LOCKS, ALLOW_PAGE_LOCKS, GNORE_DUP_KEY, STATISTICS_NORECOMPUTE 옵션을 변경할 수 있습니다.


 

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
SET (ALLOW_PAGE_LOCKS = ON)


인덱스 삭제

DROP INDEX 명령을 사용하여 테이블에 설정된 인덱스를 삭제할 수 있습니다. DROP INDEX

명령은 XML 인덱스를 포함한 전체 인덱스에 대해서 사용될 수 있습니다. SQL Server Management Stuoio의 개체 편집기의 해당 인덱스에 대한 단축메뉴에서 삭제 옵션을

용하여, 인덱스를 삭제할 수도 있습니다. DROP INDEX 명령에 대한 설명과 기능에 대해서

살펴보고, 각 기능을 설명하는 예제 구문과 코드 예제를 소개합니다.

DROP INDEX 구문
DROP INDEX 명령에 대한 옵션은 클러스터형 인덱스를 삭제하는 경우에만 사용할 수

있습니다. MOVETO 옵션은 인덱스를 삭제한 다음, 데이터를 저장할 위치를 지정하기

위해서 사용합니다.

DROP INDEX index_name
ON [schema_name.]{table_or_view_name}
[ WITH (<drop_index_option>[,...n]) ]
<drop_index_option>::=
{ ONLINE = {ON | OFF}
| MAXDOP = number_of_processors
| MOVETO { partition_scheme_name(column_name[,...n])] |
filegroup_name | DEFAULT }


인덱스 삭제
SQL Server 2005에서는 DROP INDEX 명령에 대한 구문이 변경되었습니다. 이전 버전 SQL

Server에서 사용하던 마침표(.) 형식의 구문대신, ON 절을 사용하여 삭제할 인덱스가 설정된

테이블을 지정합니다.

비활성화되어 있는 비클러스터형 인덱스도 삭제할 수 있습니다.

DROP INDEX IX_Employee_ManagerID
ON HumanResources.Employee

[참고]
이전 버전에서 사용하던 구문이 대부분 그대로 사용할 수 있기는 하지만(물론, XML

인덱스에 대해서는 예외), 신규 개발 프로젝트에서는 이전 버전에서 사용하던 구문을

사용하지 않는 것이 바람직합니다


클러스터형 인덱스를 위한 옵션지정
DROP INDEX 명령은 클러스터형 인덱스를 삭제하는 경우에 대해서만, MAXDOP 옵션과

ONLINE 옵션을 지원합니다.

비활성화되어 있는 클러스터형 인덱스는 삭제할 수 없으며, 대형개체데이터(LOB)가 포함된

클러스터형 인덱스의 경우에는 ONLINE 옵션을 사용할 수 없습니다.

DROP INDEX IX_Cluster
ON Sales.Customer
WITH (ONLINE = ON, MAXDOP = 3)


클러스터형 인덱스 데이터 위치재조정
클러스터형 인덱스를 삭제하는 경우에는, MOVETO 옵션을 사용하여 리프 페이지에 저장된

데이터 행을 저장할 위치를 지정할 수 있습니다. 클러스터형 인덱스가 삭제되면, 데이터는

지정된 위치에 테이블로 다시 생성됩니다. 데이터를 저장할 대상 위치로 파티션 스키마나

파일그룹을 지정할 수도 있습니다.

DROP INDEX IX_Cluster
ON Sales.Customer
WITH (MOVE TO NewCustomerScheme)


인덱스 조각화 관리

초기에는, 인덱스에 포함된 데이터는 기존 테이블의 행 순서에 따라 잘 정렬되어 저장됩니다. SQL Server 2005 데이터베이스 엔진에서는 테이블에 행이 삽입, 변경, 삭제될 때마다 자동적

으로 인덱스를 변경합니다. 하지만, 테이블의 데이터가 변경되는 것처럼, 데이터베이스

파일에 저장된 물리적인 저장위치가 변경되는 것은 아닙니다. 테이블의 데이터가 변경되면,

인덱스가 실제 테이블의 물리적인 행 순서와 일치하지 않으며, 결국 성능저하를 일으키는

원인이 될 수 있습니다. 이러한 현상을 조각화라고 합니다. 결과적으로, 조각화를 제거하기

위해 인덱스에 대해 재조직화 또는 재생성작업을 수행해야 합니다.

재조직화(defrag) vs 재생성(rebuild)
인덱스의 조각화정도에 따라 인덱스를 재조직화할 것인지, 재생성할 것인지를 결정하게 됩니다. 클러스터형 인덱스 또는 비클러스터형 인덱스를 재조직화하게 되면, 인덱스의 리프노드의 조각화를 제거하고, 인덱스에 설정된 채우기비율(Fillfactor)에 따라 내부노드의 정보를

정리하게 됩니다. 이러한 조각모음 작업결과, 그동안 행 삭제 및 변경으로 인해 발생한

빈공간을 제거하기 때문에, 인덱스는 그만큼 더 작게 축소되며, 실제 테이블과 동일한 순서로

리프 노드가 재정렬됩니다. 인덱스 재조직화작업은 테이블에 포함된 대량개체컬럼(LOB)도

정리하게 됩니다.

인덱스의 조각화정도가 매우 극심한 경우에는 인덱스를 재생성하는 것이 바람직합니다.

인덱스 재생성작업은 인덱스를 삭제했다가 다시 생성합니다. 인덱스를 재생성하는 경우,

채우 기비율과 같은 인덱스 관련 설정을 변경할 수 있습니다. 인덱스 재조직화의 경우는,

이러한 인덱스 관련 설정을 변경할 수 없습니다.

조각화 정보 수집
인덱스를 재생성하거나 재조직화하는 작업은 상당한 비용과 자원을 소모하는 작업입니다.
인덱스 재생성작업이 인덱스 재조직화 작업에 비해 더 높은 비용을 소모합니다 그러므로,

인덱스의 조각화정보를 조사하여 반드시 필요한 경우에만 인덱스 재생성작업을 수행하는

것이 바람직합니다. sys.dm_db_index_physical_stats 함수를 사용하여,

인덱스의 조각화정도를 수집할 수 있습니다.

다음 예제는 현재 데이터베이스내의 모든 테이블에 대해서 인덱스 조각화정보를 수집하기

위해, sys.dm_db_index_physical_stats 함수를 사용하는 방법을 나타내고 있습니다.

SELECT TableName, IndexName, AvgFragmentation
FROM sys.dm_db_index_physical_stats(DEFAULT,‘ *’, DEFAULT,‘ DETAILED’)


sys.dm_db_index_physical_stats 함수에 전달되는 매개변수는 순서에 따라 다음과 같습니다.

    @TableName. 정보를 수집할 테이블을 지정합니다. 특정 테이블의 이름을 지정할 수도

       있고, DEFAULT, NULL 을 지정할 수도 있습니다. DEFAULT 또는 NULL이 지정되면,

       sys.dm_db_index_physical_stats 함수는 현재 데이터베이스의 모든 테이블에 대한 정보를

       반환합니다.

    @IndexName. 정보를 수집할 인덱스를 지정합니다. 특정 인덱스의 이름을 지정할 수도

       있고, DEFAULT, NULL,‘ *’를 지정할 수도 있습니다. DEFAULT와 NULL이 지정되면, 기본

       테이블에 대한 정보(또는 클러스터형 인덱스에 대한 정보)만 반환합니다.
       ‘*’이 지정되면, 테이블에 존재하는 모든 인덱스에 대한 정보가 반환됩니다.

    @PartitionId. 인덱스의 분할파티션 ID 번호를 지정합니다. DEFAULE, NULL,0 으로 지정

       되면 모든 분할파티션에 대한 정보가 반환됩니다.

    @Mode. 요청된 정보를 수집하기 위한 스캔 수준을 지정합니다. LIMITED 옵션을 사용할

       것을 권고하며, 부모-수준의 페이지만 읽기 때문에 매우 빠르게 작업을 수행할 수

       있습니다. SAMPLED 옵션이 지정되면, 부모-수준의 페이지와 샘플링된 리프 페이지를

       읽게 되며, DETAILED 옵션이 지정되면, 부모-수준의 페이지와 모든 리프 페이지를 읽게

       됩니다.


sys.dm_db_index_physical_stats 함수에 대한 좀 더 자세한 정보는, SQL Server 2005 온라인

도움말의 T-SQL 참조 부분을 참조하십시오.


* 출처 : DB 가이드 넷(http://www.dbguide.net/sql2005_admin_guide/sql2005_admin_guide_06.jsp)

728x90

DMVStats 1.01

A SQL Server 2005 Dynamic Management View Performance Data Warehouse

[그림] 제 컴퓨터에 DMVStats를 설치한 뒤 Report 관리자 화면입니다.

사용자 삽입 이미지



----------------------------------------------------------------------------------

그 동안 DMV를 사용하면서

히스토리성 정보를 DW 형태로 구축하거나

이를 이용한 리포팅을 직접 만들기란 쉬운일이 아니었었죠?


이번에 제공되는 DMVStats를 이용하면 큰 도움이 되리라 생각합니다.

같이 제공되는 *.doc 파일을 보시고 따라하시면 됩니다.


일반 사용자에게는 조금 어려운 내용일 수 있는데요,

조만간 저희 회사 전문가가 세미나를 통해 소개할 예정입니다.
그 때 자세히 도움을 얻으시면 될 것 같습니다.

728x90

김정선의 좋은 글을 찾아서……
SQL Server 2005 파티션 제외(Partition Elimination) 기능

 

저자: Lubor Kollar, SQLCAT 팀 블로그

원본: http://blogs.msdn.com/sqlcat/archive/2006/02/17/Partition-Elimination-in-SQL-Server-2005.aspx


 

사용자 삽입 이미지
김정선(jskim@feelanet.com)

필라넷 DB사업부 수석컨설턴트

SQLServer 아카데미/트라이콤 교육센터 강사

 

Microsoft SQL Server MVP

MCT/MCITP/MCDBA

 

 

 

역자 서문

김정선의 좋은 글을 찾아서 번째 글이네요 ^^

Vista 사이드 바에 추가할 블로그 피드를 정리하다가, 오랜만에 sqlcat(아시죠? ^^) 블로그까지 가게 되었습니다. 좋은 글이 없나 뒤적거리다가 마침 파티션 관련된 글이 있어서 선정하게 되었습니다. 2006 2월에 쓰여진 글이네요.

 

Partition Elimination(역주: 불필요한 파티션을 검색하지 않는) 파티션 쿼리에서 성능 상에 중요한 이슈가 밖에 없습니다. 이미 이전의 파티션 뷰에서부터 그래왔으니까요. 관련된 내용이라 더욱 관심이 갔습니다. 그렇지 않아도 요즘 파티션 관련해서 복습을 하고 있거든요.

 

파티션 보셨나요? 얘기 해주세요, 읽지만 마시고 ^^

 

번역에 대해서 말씀 드리면,

번역은 역시나 역자 마음대로 합니다 ^^. 원문이 있으니 충분히 참고하실 있으실 거구요.

제가 여전히 강의나 세미나를 많이 하는 터라, 가급적 용어는 온라인 설명서(“분할이라고 번역) 맞추려고 합니다만, 파티션은 워낙 이전부터 통상적으로 써오던 표현이라 그냥 파티션이라고 했습니다.

원문 그대로 번역하지 않고 필요에 따라 생략하거나 추가 언급한 부분도 있습니다. 쉽게 읽으실 있도록

 

아무튼 좋은 글이라 생각되니, 여러분들에게도 도움이 되셨으면 합니다.

 

덧글 달아주실거죠? ^^

 

 

본문

파티션 제외 기능은 파티션 테이블이나 파티션 쿼리를 실행할 SQL Server에서 매우 중요한 부분이다. 일반적으로 SQL Server 조건자에 의해서 제외되는 파티션 영역을 스캔하지 않는 방식으로 이러한 기능을 수행해 낸다. 그런데 최근에 SQL Server 2005 파티션 테이블에 대해서 이러한 파티션 제외 기능이 제대로 동작하는 않는 시나리오를 발견했다. 여기서 문제가 되는 해당 조건과  해결 방안을 소개하고자 한다. 추가로 파티션 쿼리가 이러한 제외 기능을 수행하는지 판단하는 방법도 배우게 것이며, 정적 동적 파티션 제외가 무엇인지도 배우게 것이다. (역주: 사실 부분 때문에 번역 글로 선택했습니다. ^^)

 

파티션 제외가 제대로 수행되는지 확인하는 가장 좋은 방법은 SET STATISTICS PROFILE ON 명령을 사용하는 (혹은 그래픽 실행 계획)이다, 해당 쿼리를 실행하고 명령의 출력 결과를 확인하면 된다.

(역주: 최신 업데이트된 온라인 설명서에는 “Interpreting Execution Plans of Partitioned Objects라는 주제의 새로운 문서가 포함되어 있습니다. 내용은 짧지만, 읽어보세요 ^^ )

우선 예제 테이블부터 만들자:

 

create partition function PF1 (int) as range for values (100,200,300,400);

create partition scheme PS1 as partition PF1 all to ([PRIMARY]);

go

create table t1 (a int, b int) on PS1 (a);

go

declare @i int;

set @i=1;

set nocount on;

while (@i<22)

begin;

insert into t1 values (20*@i, @i);

set @i=@i+1;

end;

go

 

다음 쿼리는 t1 테이블의 5 파티션에 걸친 데이터의 분포를 알려준다:

 

select $partition.PF1(a) [Partition Number], a, b from t1

 

Partition Number       a         b

1                                      20         1

1                                      40         2

1                                      60         3

1                                      80         4

1                                      100       5

2                                      120       6

2                                      140       7

2                                      160       8

2                                      180       9

2                                      200       10

3                                      220       11

3                                      240       12

3                                      260       13

3                                      280       14

3                                      300       15

4                                      320       16

4                                      340       17

4                                      360       18

4                                      380       19

4                                      400       20

5                                      420       21

 

우선, SQL Server 2005에서 파티션 제외가 정상적으로 수행되는 5개의 예제를 보여줄 것이다. 그리고 정적 동적 파티션 제외의 차이를 설명한다. 출력 결과에 대해서도 이후에 확인한다.

 

set statistics profile on;

declare @i1 int;

declare @i2 int;

set @i1=50;

set @i2=250 ;

select * from t1 where a<50 or  a>450; -- (Q1) 2 파티션만 스캔

select * from t1 where a in (50,450); -- (Q2) 2 파티션만 스캔

 

select * from t1 where a<@i2 and  a>100; -- (Q3) 2 파티션만 스캔

 

select * from t1 where a=100;-- (Q4) 1 파티션만 스캔 정적 파티션 제외

select * from t1 where a=@i2; -- (Q5) 1 파티션만 스캔 동적 파티션 제외

set statistics profile off;

 

쿼리의 결과 집합 다음에 showplan 출력(역주: 흔히 말하는 쿼리 (실행) 계획) 보여준다. 여기서 “Rows” “Executes” 항목을 살펴보자.

쿼리 Q1, select * from t1 where a<50 or  a>450 대한 결과를 보면:

(역주: 쿼리 계획 상의 주석은 번역하지 않았습니다)

 

Rows     Executes             StmtText

2           1           select * from t1 where a<50 or  a>450; -- (Q1) only two partitions

2           1             |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1004]) PAR

2           1                  |--Constant Scan(VALUES:(((1)),((5))))

2           2                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

 

파티션 테이블의 스캔(검색) 파티션에 Nested Loop 반복하고 있다. 그에 앞서 Constant Scan 연산자에서 파티션 1 5만을 스캔할 것임을 있다. “Executes” 2 개별 파티션에 대해 2 스캔했음을 확인시켜준다.

 

쿼리 Q2 IN “a in (50, 450)” “a = 50 OR a = 450”으로 변환되고, 1 5 파티션만 스캔하는 것을 보여준다.

 

Rows     Executes             StmtText

0           1           select * from t1 where a in (50,450); -- (Q2) only two partitions are sc

0           1             |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1004]) PAR

2           1                  |--Constant Scan(VALUES:(((1)),((5))))

0           2                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[dbo].[t

 

번째 쿼리 Q3,

select * from t1 where a<@i2 and  a>100

결과는

 

Rows     Executes             StmtText

7           1           select * from t1 where a<@i2 and  a>100; -- (Q3) only two partitions

7           1             |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1004]) PAR

2           1                  |--Filter(WHERE:([PtnIds1004]<=RangePartitionNew([@i2],(0)

4           1                  |    |--Constant Scan(VALUES:(((2)),((3)),((4)),((5))))

7           2                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

 

Constant Scan 연산자를 보면, 우선 정적으로 파티션 1 제외된 것을 있다. 이는 “a > 100”이라는 조건절 때문에 가능한 것이다. 그리고 위에 Filter 연산자의 내용을 보면 “a < @i2” 조건자를 사용해서 암시적으로 보다 많은 파티션을 제외하고 있다. 후자가 바로 동적 제외이다. 이는 제외할 파티션을 결정하는데 사용될 로컬변수 @i2 값을 컴파일 타임이 아닌 런타임에 있기 때문이다. 실제로 Table Scan 연산자의 “Executes” 항목을 보면 2번만 스캔하고 있음을 있다.

 

쿼리 Q4

select * from t1 where a=100

앞서 4개의 쿼리와 달리 쿼리는 Constant Scan 연산자가 없다. 이는 SQL Server 컴파일 타임에 하나의 파티션만 필요하다는 것을 있기 때문이다. 아래 쿼리 계획을 보면

 

Rows     Executes             StmtText

1           1           SELECT * FROM [t1] WHERE [a]=@1

1           1             |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[dbo]. [t1].[a]=(100)) PARTITION ID:((1)))

 

이를 쿼리 Q5 비교해 보면

select * from t1 where a=@i2.

물론 최종 실행은 하나의 파티션만 스캔하고 있지만 컴파일 타임에는 로컬변수 값을 없다. 따라서 WHERE절이 매개변수로 처리되고 있다.

 

Rows     Executes             StmtText

0           1           select * from t1 where a=@i2; -- (Q5) only one partition is scanned 0          1             |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[dbo].[t1].[a]=[@i2]) PARTITION ID:(RangePartitionNew([@i2],(0),(100),(200),(300),(400))))

 

예제는 SQL Server 파티션 제외 기능이 제대로 수행되고 있음을 보여준다.

 

 

이제 다음의 경우를 살펴보자

 

set statistics profile on;

declare @i1 int;

declare @i2 int;

set @i1=50;

set @i2=250;

select * from t1 where a<50 or  a>@i2; -- (Q6)

select * from t1 where a<@i1 or  a>@i2; -- (Q7)

select * from t1 where a in (@i1,@i2); -- (Q8)

 

set statistics profile off;

 

경계 (100, 200, 300, 400) 쿼리의 로컬변수 @i1=50, @i2=250 따져 보면, 쿼리 Q6 Q7 번째 파티션(200미만) 제외할 있다고 판단된다. 그런데, Q6 Q7 쿼리 계획을 보면,

 

-- Q6

Rows     Executes             StmtText

11         1           select * from t1 where a<50 or  a>@i2 -- (Q6) all partitions are

11         1             |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1004]) PAR

5           1                  |--Constant Scan(VALUES:(((1)),((2)),((3)),((4)),((5))))

11         5                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

 

-- Q7

Rows     Executes             StmtText

11         1           select * from t1 where a<@i1 or  a>@i2 -- (Q7) all partitions are

11         1             |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1004]) PAR

5           1                  |--Constant Scan(VALUES:(((1)),((2)),((3)),((4)),((5))))

11         5                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

 

쿼리 Q8 경우는 파티션 1 3만을 스캔하면 된다. 그런데 5 모두 스캔하고 있다.

 

Rows     Executes             StmtText

0           1           select * from t1 where a in (@i1,@i2) -- (Q8)

0           1             |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1004]) PAR

5           1                  |--Constant Scan(VALUES:(((1)),((2)),((3)),((4)),((5))))

0           5                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

 

 

SQL Server 2005에서 가지의 경우 모든 파티션을 스캔하고 있다. “SQL Server에서의 파티션 제외 기능은 제외식을 가진 조건자 사이에 OR 있고 매개변수화가 되는 경우 제대로 동작하지 않는다.”

IN 조건자 또한 OR 조건자로 변환될 것이고 하나가 매개 변수 값을 가지므로 조건에 만족한다.

(역주: 글의 답글을 보면, 유사 케이스도 있습니다)

 

해결 방법은 여러 가지가 존재한다. 가장 편한 방법은 OR 대신에 UNION ALL 사용하는 것이다. Q6 경우라면

 

select * from t1 where a<50

UNION ALL

select * from t1 where a>@i2

 

쿼리 계획은

 

Rows     Executes             StmtText

11         1           select * from t1 where a<50   UNION ALL  select * from t1 where a

11         1             |--Concatenation

2           1                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

9           1                  |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1011]

3           1                       |--Filter(WHERE:([PtnIds1011]>=RangePartitionNew([@i2

5           1                       |    |--Constant Scan(VALUES:(((1)),((2)),((3)),((4))

9           3                       |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([tes

 

쿼리 계획을 보면 조건자 “a < 50” 대해서는 정적 제외를 하고 “a > @i2” 대해서는 동적 파티션 제외가 수행됨을 있다. 번째 것은 단일 파티션만 처리하고 번째(a >  250)에서 이후 3개의 파티션을 스캔할 것이다.

 

번째 쿼리 Q7 다음과 같이 작성할 있다.

 

select * from t1 where a<@i1

UNION ALL

select * from t1 where a>@i2

 

변경된 쿼리 계획은(역주: 예상하겠지만 ^^)                 

 

Rows     Executes             StmtText

11         1           select * from t1 where a<@i1   UNION ALL  select * from t1 where

11         1             |--Concatenation

2           1                  |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1010]

1           1                  |    |--Filter(WHERE:([PtnIds1010]<=RangePartitionNew([@i1

5           1                  |    |    |--Constant Scan(VALUES:(((1)),((2)),((3)),((4))

2           1                  |    |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([tes

9           1                  |--Nested Loops(Inner Join, OUTER REFERENCES:([PtnIds1011]

3           1                       |--Filter(WHERE:([PtnIds1011]>=RangePartitionNew([@i2

5           1                       |    |--Constant Scan(VALUES:(((1)),((2)),((3)),((4))

9           3                       |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([tes

 

번째 쿼리 Q7 또한 다음과 같다.

 

select * from t1 where a =@i1    

UNION ALL

select * from t1 where a =@i2

 

역시 실행 계획도

 

Rows     Executes             StmtText

0           1           select * from t1 where a =@i1   -- (Q7)   UNION ALL  select * fro

0           1             |--Concatenation

0           1                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

0           1                  |--Table Scan(OBJECT:([test].[dbo].[t1]), WHERE:([test].[d

 

(역주: OR 문제를 해결하는데 많은 사용되는 것이 UNION ALL이죠! 이유는? 실행 계획을 명시적으로 분리할 있으니까! 그런데 방법 밖에 없나?, 그럼 안되는데…^^ )

 

또는 동적 쿼리 형태로 문자열로 쿼리를 결합해서 결합된 쿼리를 수행하도록 처리할 수도 있다.

 

(역주: 만일 쿼리를 UNION 바꿀 수도 없고, 동적 쿼리로 바꾸기에 너무 () 쿼리라면 어떻게 해야 하나?...여러분 다른 방법을 찾아주세요~~~ help me~~~)

 

요약

SQL Server에서 파티션 제외 기능을 확인하는 방법을 살펴봤다. 대부분의 경우 SQL Server 이를 훌륭히 처리해 주겠지만, 위에서 소개된 사례와 같이 제대로 수행되지 못하는 경우도 발생한다. 이런 경우에 반드시 쿼리 계획을 확인하고, 해당 쿼리가 정적 혹은 동적 파티션 제외가 제대로 수행되는지 확인해야 한다. SQL Server 개발 팀은 향후 서비스 팩이나 릴리스에서 위에서 언급한 문제들을 해결할 계획을 세우고 있다.

(역주: 현재 SP2, 9.00.3042 버전에서 테스트한 결과 아직 반영 ^^, SQL Server 2008은 어떨까요? ^^)

 

+ Recent posts