728x90

김연욱(Vichang)님의 Inside Query Performance - (1)

 

안녕하세요. 김대우 입니다. 더운 여름 잘 지내고 계신지요?

이번에 소개해 드릴 내용은 김연욱님이 이끌어 주시는 Inside Query Performance 입니다.

아주 좋은 SQL 쿼리 성능에 대한 연재글을 올려 주고 계시며 SQLER에 많은 도움을 주시는 분이지요.

이하 내용은 김연욱님이 SQLER 자유게시판에 올려주신 항목을 정리한 내용입니다.

언제나 많은 도움 주시는 김연욱님 감사 드리구요. 앞으로도 좋은... 더운 여름 더더욱 열나게 하는 ^_^;;;

좋은 글 부탁 드립니다. 감사합니다.

이하 김연욱님의 글입니다.


 

 

1. 문자컬럼에다가 숫자컬럼을 비교하면 인덱스를 타는가 ?

2. 숫자컬럼에다가 문자컬럼을 비교하면 인덱스를 타는가 ?

3. 문자컬럼에다가 datetime컬럼을 비교하면 인덱스를 타는가 ?

4. datetime컬럼에다가 문자컬럼을 비교하면 인덱스를 타는가 ?

 

밑에 결과 보지말구 그냥 5초만 생각보세요.

중수이상 되시는 분은 빨랑 백스페이스를 눌러서 나가주세용.

 

--tempdb에서 테스트
use tempdb
go


--있으면 지우고
drop table a
go


--테스트용 테이블 하나 만들고
create table a(id int identity, cha varchar(10))
go
 

--역시나 테스트용 데이터 넣구
set nocount on
go
declare @i int
set @i = 1
while (@i <= 10000)
begin
insert into a(cha) values (convert(varchar(10), @i))
set @i = @i + 1
end
go
set nocount off
go


--인덱스 만들구
create index idx on a (cha)
create index idx2 on a (id)
go

--테스트를 위해 io량을 보고, 실행계획을 보기위해 설정
set statistics io on
set statistics profile on
go

 


 

 

--어떤경우에 인덱스를 쓸까 ?
--1. 그냥한번 풀로 읽어보면
select * from a

 

|--Table Scan(OBJECT:([tempdb].[dbo].[a]))

'a' 테이블. 스캔 수 1, 논리적 읽기 수 28
 

 

--2. 정상적으로 컬럼형식을 맞춰서 검색하면 ?
select * from a where id = 1

 


|--Bookmark Lookup(BOOKMARK:([Bmk1000]), OBJECT:([tempdb].[dbo].[a]))
       |--Index Seek(OBJECT:([tempdb].[dbo].[a].[idx2]), SEEK:([a].[id]=Convert([@1])) ORDERED FORWARD)

'a' 테이블. 스캔 수 1, 논리적 읽기 수 3

 

 

select * from a where cha='1'

 

|--Bookmark Lookup(BOOKMARK:([Bmk1000]), OBJECT:([tempdb].[dbo].[a]))
       |--Index Seek(OBJECT:([tempdb].[dbo].[a].[idx]), SEEK:([a].[cha]='1') ORDERED FORWARD)

'a' 테이블. 스캔 수 1, 논리적 읽기 수 3
--제대로 3페이지만 인덱스를 사용하여 검색

 

 

--3. 그럼 숫자컬럼에다가 문자를 비교하면 ?
select * from a where id = '1'

 


|--Bookmark Lookup(BOOKMARK:([Bmk1000]), OBJECT:([tempdb].[dbo].[a]))
       |--Index Seek(OBJECT:([tempdb].[dbo].[a].[idx2]), SEEK:([a].[id]=Convert([@1])) ORDERED FORWARD)

'a' 테이블. 스캔 수 1, 논리적 읽기 수 3

 

 

--4. 문자컬럼에다가 숫자를 비교하면 ?
select * from a where cha=1

 


  |--Table Scan(OBJECT:([tempdb].[dbo].[a]), WHERE:(Convert([a].[cha])=Convert([@1])))

'a' 테이블. 스캔 수 1, 논리적 읽기 수 28

--웬 테이블 스캔....

생각하신대로 결과가 나왔나요 ?


그럼 이번에는 많이 사용하는 datetime 컬럼을 테스트해보자.

 

--다른 샘플을 만들기 위해 잠시 off시키고
set statistics io off
set statistics profile off
go
 

--있으면 지우고
drop table b
go
 

--테스트용 테이블 하나 만들고
create table b(dt1 datetime, dt2 char(8))
go
 

--역시나 테스트용 데이터 넣구
set nocount on
go
declare @i datetime
set @i = '2000-01-01'
while (@i <= '2003-12-31')
begin
insert into b values (@i, convert(varchar(8), @i, 112))
set @i = dateadd(dd, 1, @i)
end
go
set nocount off
go
 

--인덱스 만들구
create index idx on b (dt1)
create index idx2 on b (dt2)
go

--테스트를 위해 io량을 보고, 실행계획을 보기위해 설정
set statistics io on
set statistics profile on
go

 



 

 

--어떤경우에 인덱스를 쓸까 ?
--1. 그냥한번 풀로 읽어보면
select * from b

 


|--Table Scan(OBJECT:([tempdb].[dbo].[b]))

'b' 테이블. 스캔 수 1, 논리적 읽기 수 5

 

 

--2. 정상적으로 컬럼형식을 맞춰서 검색하면 ?
declare @dt1 datetime
set @dt1 = '2003-05-05'
select * from b where dt1 = @dt1

 


|--Bookmark Lookup(BOOKMARK:([Bmk1000]), OBJECT:([tempdb].[dbo].[b]))
       |--Index Seek(OBJECT:([tempdb].[dbo].[b].[idx]), SEEK:([b].[dt1]=[@dt1]) ORDERED FORWARD)

'b' 테이블. 스캔 수 1, 논리적 읽기 수 3

 

 

declare @dt2 char(8)
set @dt2 = '20030505'
select * from b where dt2 = @dt2

 


|--Bookmark Lookup(BOOKMARK:([Bmk1000]), OBJECT:([tempdb].[dbo].[b]))
       |--Index Seek(OBJECT:([tempdb].[dbo].[b].[idx2]), SEEK:([b].[dt2]=[@dt2]) ORDERED FORWARD)

'b' 테이블. 스캔 수 1, 논리적 읽기 수 3

 

 

--3. datetime 컬럼에다가 문자를 비교하면 ?
declare @dt2 char(8)
set @dt2 = '20030505'
select * from b where dt1 = @dt2

 


|--Bookmark Lookup(BOOKMARK:([Bmk1000]), OBJECT:([tempdb].[dbo].[b]))
       |--Index Seek(OBJECT:([tempdb].[dbo].[b].[idx]), SEEK:([b].[dt1]=Convert([@dt2])) ORDERED FORWARD)

'b' 테이블. 스캔 수 1, 논리적 읽기 수 3

 

 

--4. 문자컬럼에다가 datetime을 비교하면 ?
declare @dt1 datetime
set @dt1 = '2003-05-05'
select * from b where dt2 = @dt1

 


|--Table Scan(OBJECT:([tempdb].[dbo].[b]), WHERE:(Convert([b].[dt2])=[@dt1]))

'b' 테이블. 스캔 수 1, 논리적 읽기 수 5


--웬 테이블 스캔....

 

생각하신대로 결과가 나왔나요 ?
 



결론, 문자대 숫자의 비교는 무조건 문자를 숫자로 변환후, 또는 문자를 datetime형으로

변환후 비교할려구 한다.(자동형변환에 의하야 - 무조건 형식을 맟춰서 사용해야하겠네요.)

프로그램 개발시 주의하세요 !!!

난이의 밥벌이에 대해서 좀더 알아 보도록 하겠습니다. ^_^

 


김연욱(Vichang)님의 Inside Query Performance - (1)

 

저작권 : 이 홈페이지의 내용은 모두 자유롭게 사용하실 수 있습니다.

728x90

인덱스 관리 개선기능

인덱스는 데이터베이스에 저장된 데이터에 좀 더 빠른 접근을 가능하게 하는 핵심 기능입니다.

하지만, 데이터베이스에 저장된 데이터가 변경됨에 따라 적절한 인덱스를 유지 보수하는 작업은

상당한 시간과 자원을 필요로 합니다. 데이터베이스 관리자가 인덱스를 생성, 변경, 삭제하는

방법을 이해하고 있어야 할 뿐만 아니라, 인덱스가 적절하게 사용될 수 있도록 조각화에 대한

대처 방법을 알고 있어야 합니다.

SQL Server 2005에서는 인덱스 관리측면에서 뛰어난 개선기능을 제공하며, 새로운 DDL 문장과

인덱스 관련 기능이 제공됩니다.


SQL Server 2005의 새로운 인덱스 관리 기능

SQL Server 2005에서도, SQL Server 2000과 마찬가지로 클러스터형 인덱스와 비클러스터형

인덱스를 제공합니다. 또한, 계산된 컬럼이나 뷰에 대해서도 인덱스를 생성할 수 있습니다.

하지만, SQL Server 2005에서는 인덱스를 생성하고 처리하는 방법에 대한 개선된 기능을

제공하고, 새로운 형식의 인덱스를 생성할 수 있습니다.

ALTER INDEX 구문
SQL Server 2005의 새로운 인덱스 관련 기능 중 하나는 ALTER INDEX T-SQL 구문에 대한

지원으로, 인덱스를 재생성하고, 재조직하고, 비활성화하고, 인덱스 관련 옵션을 조정하기

위해서 사용합니다. ALTER INDEX 구문을 사용하면, 인덱스의 조각모음을 위해 인덱스를

삭제하고 재 생성할 필요가 없어집니다. 또한, 이전 버전 SQL Server에서 사용하였던

DBCC 명령의 일부를 대체하게 됩니다.

온라인 인덱스 작업
SQL Server 2005에서는 인덱스가 사용중인 상태에서 인덱스에 대한 관리작업을 수행할 수

있기 때문에, 관리작업을 위한 부하가 최소화될 수 있습니다. 이전 버전 SQL Server에서는

인덱스에 대한 작업을 하는 동안 테이블과 인덱스에 대해서 배타적 잠금을 설정하였기

때문에, 인덱스 작업이 완료될 때까지는 해당 테이블에 차단현상이 발생하였습니다.

온라인 인덱스 작업을 수행하기 위해서는 해당 작업을 지원하기 위한 추가적인 디스크

공간이 필요합니다. CREATE INDEX, ALTER INDEX, DROP INDEX 명령을 실행할 때는,

해당작업을 온라인으로 작업할 것인지 여부를 지정해야 합니다.

병렬인덱스 작업
인덱스를 생성, 변경, 삭제하는 작업에는 정렬 및 스캔을 작업을 위해 여러 개의 CPU를

사용하여 병렬처리 작업을 수행하는 것이 효과적입니다. SQL Server 2005에서는 인덱스

작업에 대한 병렬처리가 자동으로 수행되며, 별도의 MAXDOP 옵션을 지정하여 병렬처리에

사용할 CPU 개수를 지정할 수 있습니다. CREATE INDEX, ATLER INDEX, DROP INDEX TSQL

명령을 수행할 때 MAXDOP 쿼리 힌트를 사용하여 해당 작업에 대한 병렬처리를 위해 사용

할 CPU 개수를 지정할 수 있습니다.

잠금옵션
SQL Server 2005에서는 인덱스를 사용할 때, 새로운 두 가지 잠금 옵션을 제공합니다. 두가지

잠금옵션은 동시에 활성화될 수 있습니다.

    ALLOW_PAGE_LOCKS
       ALLOW_PAGE_LOCK 옵션이 ON으로 설정되면, 테이블 잠금이나 페이지 잠금을 사용하여

       인덱스에 접근하도록 설정합니다. OFF로 설정되면, 페이지 잠금이 사용되지 않습니다.

    ALLOW_ROW_LOCKS
       ALLOW_ROW_LOCKS 옵션이 ON으로 설정되면, 테이블 잠금이나 행 단위 잠금을 사용하여

       인덱스에 접근하도록 설정합니다. OFF로 설정되면, 행 단위 잠금이 사용되지 않습니다.

인덱스에 포함되는 컬럼 지정
SQL Server 2005에 비클러스터형 인덱스에는 리프 노드에 인덱스 키가 아닌 데이터도 포함될

수 있습니다. 인덱스에 포함된 컬럼에 대한 접근이 필요한 쿼리가 커버된 쿼리로 실행될 수

있기 때문에 성능을 향상시킬 수 있지만, 해당 데이터를 관리하기 위한 별도의 추가적인

디스크 공간이 필요합니다. 인덱스에 포함된 컬럼은 이전 버전 SQL Server에서 사용하였던

커버된 인덱스의 기능을 대체하기 위해 사용됩니다.

인덱스에 포함되는 컬럼을 지정하는 기능의 부가효과로 인덱스 키에 대한 크기의 제약이

확장됩니다. SQL Server 2000에서는 인덱스 키값의 최대 크기가 900 바이트로 제한되어

있었습니다. SQL Server 2005의 인덱스에 포함된 컬럼기능을 사용하면, 인덱스의 리프

노드에, 최대 행 크기과 동일하게, 8060 바이트까지 저장할 수 있습니다.

분할 인덱스 (Partition)
분할 인덱스는 SQL Server 2005의 인덱스 관련 주요 개선 중 하나입니다. 분할 인덱스이란,

인덱스를 하나 이상으로 구성된 파일그룹에 분산하여 저장하는 기능입니다. 인덱스 분할은

주로 분할된 테이블에 생성됩니다. 분할 인덱스는 데이터를 여러 개의 파일에 분산시키기

때문에 성능을 향상시킬 수 있고, 경합현상을 줄여줄 수 있으며, IO 작업이 병렬로 처리될 수

있는 가능성을 높여주는 역할을 합니다.

분할 인덱스에 대한 좀 더 자세한 정보는 SQL Server 2005 온라인 도움말의“분할 테이블 및

인덱스의 개념”부분을 참조하십시오.

XML 인덱스
SQL Server 2005 에서는 XML 데이터형을 지원합니다. CREATE PRIMARY XML INDEX와 CREATE XML INDEX T-SQL 명령을 사용하여 XML 데이터형 컬럼에 XML 인덱스를 생성할 수

있습니다. XML 인덱스는 XML 데이터형 컬럼에 데이터가 변경되었을 때 부가적인 비용을

발생시키기는 하지만, XML 데이터에 대한 XQuery 작업의 성능을 극적으로 향상시켜 줍니다.

XML 인덱스에 대해서는 몇 가지 제약사항이 있습니다. XML 인덱스에 대한 좀 더 자세한

정보는 SQL Server 2005 온란인 도움말의“XML 데이터 유형 열의 인덱스”부분을 참조하십시오.


인덱스 생성

CREATE INDEX 명령에 대한 설명과 기능에 대해서 살펴보고, 각 기능을 설명하는 예제

문과 코드 예제를 소개합니다.

Create Index 구문
CREATE INDEX 명령은 인덱스를 생성하는 역할을 합니다. SQL Server 2005에서는 새로운

인덱스 관련 기능을 지원하기 위해 CREATE INDEX 구문에 대한 기능이 확장되었습니다.

새로운 인덱스 관련 기능을 사용하기 위해서, SQL Server Management Studio의 개체

탐색기의 새 인덱스 생성 대화상자를 사용할 수 있습니다.

[참고]
CREATE INDEX 명령에서 유지 관리 마법사에서 사용하는 PAD_INDEX, SORT_IN_TEMPdb, IGNORE_DUP_KEY, ONLINE 옵션도 지정하여 사용할 수 있습니다.


CREATE [UNIQUE][CLUSTERED | NONCLUSTERED] INDEX index_name
ON [{database_name.[schema_name]. | schema_name.}]
{table_or_view_name}(column [ASC | DESC][,...n])
[INCLUDE (column_name[,...n])]
[WITH(<relational_index_option>[,...n])]
[ON {partition_scheme_name(column_name[,...n])
| filegroup_name | DEFAULT}]
<relation_index_option>::=
{ PAD_INDEX = {ON | OFF}
| FILLFACTOR = fillfactor
| SORT_IN_TEMPDB = {ON | OFF}
| IGNORE_DUP_KEY = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF} | DROP_EXISTING = {ON | OFF}
| ONLINE = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}
| ALLOW_PAGE_LOCKS = {ON | OFF}
| MAXDOP = number_of_processors }


온라인 인덱스 작업
CREATE INDEX 구문의 WITH 절에 ONLINE=ON 옵션을 지정하면, 인덱스 생성작업을 다른 DML 작업과 병행해서 수행할 수 있습니다.

[참고]
xml, text, ntext, image, varchar(max), nvarchar(max), varbinary(max), filestream 데이터형이

사용된 테이블의 경우에는 온라인 인덱스 작업을 수행할 수 없습니다.


CREATE INDEX IX_Employee_ManagerID
ON HumanResources.Employee (ManagerID)
WITH (ONLINE=ON)

 

병렬처리수준 지정
기본값으로, 데이터베이스 엔진에서는 최대병렬처리수준(MAXDOP) 구성옵션의 값을

기준으로 인덱스를 생성하는 작업에서 사용할 최대 CPU 수를 결정하게 됩니다. 필요에 따라,

인덱스 작업과 병행하여 처리되는 다른 작업에 영향을 최소화하기 위해, 별도의 MAXDOP

옵션을 지정하여, 인덱스 작업에서 사용하는 CPU를 제한할 수 있습니다.

MAXDOP 옵션을 지정하면, 서버에 구성되어 있는 최대병렬처리수준(MAXDOP) 옵션값보다

우선하여 적용됩니다. MAXDOP =0이라고 지정하면, 현재 데이터베이스 엔진의 작업부하를

고려한 상태에서, 사용할 수 있는 전체 CPU를 인덱스 작업에 사용합니다.

[참고]
ONLINE 옵션과 함께, 인덱스 생성, 변경, 삭제 작업에만 적용되는 별도의 MAXDOP 옵션을

설정할 수 있습니다. 쿼리 최적화기에서는 해당 인덱스를 참조하는 쿼리를 최적화하기

위해서 기존에 설정된 최대병렬처리수준 (MAXDOP) 구성을 사용합니다.

CREATE INDEX IX_Employee_ManagerID
ON HumanResources.Employee (ManagerID)
WITH (ONLINE=ON, MAXDOP = 3)


인덱스에 포함할 컬럼 지정
인덱스 리프(leaf) 노드에 포함될 컬럼을 추가로 지정할 수 있습니다.
커버된 인덱스를 생성하기 위해, 예제와 같이, AddressLine1 컬럼과, AddressLine2 컬럼을 AddressID컬럼에 대한 인덱스에 추가할 수 있습니다. 하지만, 해당 테이블에 대한 INSERT, UPDATE, DELETE 작업을 수행할 때는, 인덱스에 중복된 데이터를 유지하기 위해 추가

오버헤드가 발생하게 됩니다.

text, ntext, image 데이터형 컬럼에 대해서는 사용할 수 없습니다.

CREATE INDEX IX_AddressDetails
ON Person.Address (AddressID)
INCLUDE (AddressLine1, AddressLine2)


인덱스 분할(Partition)
CREATE INDEX 명령에 파일그룹과 파티션 스키마를 지정하여 분할 인덱스를 정의할 수

있습니다.

인덱스가 설정된 테이블은 분할된 상태이고, 인덱스 분할을 지정하지 않은 상태라면, 해당

인덱스는 테이블이 사용하고 있는 파티션 스키마와 동일한 위치에 생성됩니다.

CREATE INDEX IX_CustomerDetails
ON Sales.Customer(CustomerID)
ON Sales.CustomerScheme(CustomerID)


XML 인덱스 생성
CREATE [PRIMARY] XML INDEX 명령을 사용하여 XML 인덱스를 생성할 수 있습니다.
테이블에 XML 인덱스를 생성하기 전에 해당 테이블에 반드시 클러스터형 인덱스를 생성해야 합니다. 부가(secondary) XML 인덱스를 생성하기 전에, 해당 XML 컬럼에 기본(primary)

XML 인덱스가 생성되어 있어야 합니다. XML 인덱스를 생성할 때는, ONLINE 옵션을 사용할

수 없습니다.

CREATE [PRIMARY] XML INDEX index_name
ON [{database_name.[schema_name]. | schema_name.}]table_name
(xml_column_name)
[ USING XML INDEX xml_index_name
[ FOR { VALUE | PATH } ]
[WITH(<xml_index_option>[,...n])]
<xml_index_option>::=
{ PAD_INDEX = {ON | OFF}
| FILLFACTOR = fillfactor
| SORT_IN_TEMPDB = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF}
| DROP_EXISTING = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}
| ALLOW_PAGE_LOCKS = {ON | OFF}
| MAXDOP = number_of_processors }


다음과 같은 구문으로 XML 인덱스를 생성할 수 있습니다.

CREATE PRIMARY
XML INDEX IXML_ContactAddContact
ON Person.Contact(AdditionalContactInfo)

인덱스 수정

ALTER INDEX 명령에 대한 설명과 기능에 대해서 살펴보고, 각 기능을 설명하는 예제 구문과

코드 예제를 소개합니다

ALTER INDEX 구문
ALTER INDEX 구문은 인덱스를 재생성하고, 재조직화하고, 비활성화하고, 인덱스 관련 옵션을 변경하기 위해서 사용합니다. SQL Server Management Studio의 개체 탐색기의 인덱스 속성

대화상자를 통해 인덱스에 대한 변경작업을 수행할 수 있습니다.

다음 표는 ALTER INDEX 명령을 사용하여 수행할 수 있는 각 작업에 대한 간략한 설명입니다.

키워드 설명
REBUILD

인덱스를 재생성하면, 테이블에 저장된 데이터의 내부구조에 따라 인덱스를 재정렬하게 되고, 인덱스가 사용하고 있는 디스크 공간을 축소하기 위하여,

인덱스를 삭제했다가 다시 생성합니다.

REORGANIZE 테이블에 저장된 데이터의 논리적인 순서에 따라 인덱스의 리프 페이지를 재정렬합니다.
DISABLE 해당 인덱스를 사용하지 못하도록 하기 위해서 특정 인덱스(클러스터형 인덱스도 포함)를 비활성화합니다.
SET

인덱스를 유지관리하고 접근방법을 지정하기 위해 사용되는 인덱스 옵션을

조정합니다.


ALTER INDEX 명령은 인덱스 분할 정보를 변경하거나, 해당 인덱스에 컬럼을 추가하거나

삭제하기 위해서는 사용할 수 없습니다. 이러한 작업을 수행하기 위해서는 CREATE INDEX

명령을 WITH DROP_EXISTING 옵션과 함께 사용해야 합니다.

 

ALTER INDEX {index_name | ALL}
ON [{database_name.[schema_name]. | schema_name.}]
{table_or_view_name}
{ REBUILD [WITH(<rebuild_index_option>[,...n])]
| REORGANIZE [ WITH( LOB_COMPACTION = {ON | OFF})]
| DISABLE
| SET (<set_index_option>[,...n]) }

<rebuild_index_option>::=
{ PAD_INDEX = {ON | OFF}
| FILLFACTOR = fillfactor
| SORT_IN_TEMPDB = {ON | OFF}
| IGNORE_DUP_KEY = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF}
| ONLINE = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}
| ALLOW_PAGE_LOCKS = {ON | OFF}
| MAXDOP = number_of_processors }

<set_index_option>::=
{ IGNORE_DUP_KEY = {ON | OFF}
| STATISTICS_NO_RECOMPUTE = {ON | OFF}
| ALLOW_ROW_LOCKS = {ON | OFF}


인덱스 재생성
REBUILD 절을 통해, FILLFACTOR, PAD_INDEX, SORT_IN_TEMPDB, IGNORE_DUP_KEY, STATISTICS_NORECOMPUTE 등의 옵션을 지정하여 인덱스의 구조를 변경할 수 있습니다.

온라인 작업으로 크기가 큰 인덱스(128 익스텐트 이상의 인덱스)를 재생성하게 되면, 데이터

베이스 엔진은 해당 인덱스가 사용하고 있던 기존 디스크 공간을 할당해제하기 전에 새로운

디스크 공간을 할당한 다음, 인덱스관련 데이터를 복사한 다음 재정렬작업을 수행합니다.

반드시 인덱스 재생성 작업을 수행하기 전에는 해당 작업을 수행할 수 있을 만한 충분한

디스크 공간을 확보해 두어야 합니다.

[참고]
클러스터형 인덱스를 재성성한다고 해서 자동으로 모든 비클러스터형 인덱스가 재생성되지는 않습니다. 하지만, ALTER INDEX ALL … REBUILD … 명령을 사용하여 단일 작업으로 특정 테이블에 존재하는 모든 인덱스를 삭제하고 다시 생성할 수 있습니다.

 

REBUILD 절에 ONLINE=ON 옵션을 지정하면, 온라인 작업으로 인덱스에 대한 변경작업을 수행

할 수 있고, MAXDOP 옵션을 지정하면, 별도의 최대병렬처리정도를 지정할 수 있습니다.

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
REBUILD WITH (FILLFACTOR = 80)


인덱스 재조직화
인덱스를 재조직화하면, 인덱스를 사용하여 순차적인 행을 대량으로 스캔하는 작업을

수행하는 쿼리의 성능을 향상시킬 수 있습니다. 재조직화된 인덱스는 이미 할당되어 있는

동일한 인덱스 페이지를 재사용하게 되며, 인덱스 재조직화의 결과로 완전히 빈 상태가 된

페이지만 할당해제하게 됩니다. 또한, 인덱스 재조직화작업은 Tempdb에 추가적인 작업

공간을 필요로 하지 않게 되면, 모든 데이터는 기존 인덱스 페이지내에서 재분배됩니다.

REORGANIZE 절에 지정할 수 있는 유일한 옵션은 LOB_COMPACTION으로, 대량개체데이터(image, text, ntext, varchar(max), nvarchar(max), varbinary(max)형 데이터)도 재조직화하도록

설정합니다.

인덱스 재조직화작업은 항상 온라인으로 수행되기 때문에, 병행해서 수행되는 동시성 쿼리나 데이터 변경작업을 차단하지 않습니다. MAXDOP 옵션을 별도로 지정할 수 없으며, 서버에

설정된 최대병렬처리정도(MAXDOP) 옵션도 무시됩니다.

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
REORGANIZE WIT


인덱스 비활성화
쿼리 최적화기는 SQL 문장에 대한 실행계획을 수립할 때, 비활성화되어 있는 인덱스는

고려의 대상으로 포함시키지 않습니다. 비활성화되어 있는 인덱스에 대한 참조 힌트가 설정된 경우에는 쿼리 최적화기에서 오류를 발생시킵니다. 인덱스가 비활성화되면, 해당 인덱스에

연결된 모든 제약조건과 기본키 및 외래키 제약조건도 함께 비활성화됩니다.

데이터베이스 엔진은 비활성화된 인덱스를 유지보수하지 않습니다. ALTER INDEX…REBUILD… 명령이나 CREATE INDEX… WITH DROP_EXISTING 명령을 사용하여, 인덱스를 다시 활성화할

수 있습니다. ALTER TABLE 명령을 사용하여 비활성화된 제약조건도 반드시 활성화시켜

주어야 합니다.

[참고]
테이블에 대해 클러스터형 인덱스를 비활성화한 경우에는, 테이블이 OFFLINE 상태로

표시됩니다. 모든 어플리케이션에서는 해당 클러스터형 인덱스가 활성화될 때가지는

해당 테이블을 사용할 수 없습니다. 물론, SELECT 쿼리를 수행할 수도 없습니다.

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
DISABLE


인덱스 옵션 변경
SET 절을 사용하여 인덱스에 사용하는 ALLOW_ROW_LOCKS, ALLOW_PAGE_LOCKS, GNORE_DUP_KEY, STATISTICS_NORECOMPUTE 옵션을 변경할 수 있습니다.


 

ALTER INDEX IX_Employee_ManagerID
ON HumanResources.Employee
SET (ALLOW_PAGE_LOCKS = ON)


인덱스 삭제

DROP INDEX 명령을 사용하여 테이블에 설정된 인덱스를 삭제할 수 있습니다. DROP INDEX

명령은 XML 인덱스를 포함한 전체 인덱스에 대해서 사용될 수 있습니다. SQL Server Management Stuoio의 개체 편집기의 해당 인덱스에 대한 단축메뉴에서 삭제 옵션을

용하여, 인덱스를 삭제할 수도 있습니다. DROP INDEX 명령에 대한 설명과 기능에 대해서

살펴보고, 각 기능을 설명하는 예제 구문과 코드 예제를 소개합니다.

DROP INDEX 구문
DROP INDEX 명령에 대한 옵션은 클러스터형 인덱스를 삭제하는 경우에만 사용할 수

있습니다. MOVETO 옵션은 인덱스를 삭제한 다음, 데이터를 저장할 위치를 지정하기

위해서 사용합니다.

DROP INDEX index_name
ON [schema_name.]{table_or_view_name}
[ WITH (<drop_index_option>[,...n]) ]
<drop_index_option>::=
{ ONLINE = {ON | OFF}
| MAXDOP = number_of_processors
| MOVETO { partition_scheme_name(column_name[,...n])] |
filegroup_name | DEFAULT }


인덱스 삭제
SQL Server 2005에서는 DROP INDEX 명령에 대한 구문이 변경되었습니다. 이전 버전 SQL

Server에서 사용하던 마침표(.) 형식의 구문대신, ON 절을 사용하여 삭제할 인덱스가 설정된

테이블을 지정합니다.

비활성화되어 있는 비클러스터형 인덱스도 삭제할 수 있습니다.

DROP INDEX IX_Employee_ManagerID
ON HumanResources.Employee

[참고]
이전 버전에서 사용하던 구문이 대부분 그대로 사용할 수 있기는 하지만(물론, XML

인덱스에 대해서는 예외), 신규 개발 프로젝트에서는 이전 버전에서 사용하던 구문을

사용하지 않는 것이 바람직합니다


클러스터형 인덱스를 위한 옵션지정
DROP INDEX 명령은 클러스터형 인덱스를 삭제하는 경우에 대해서만, MAXDOP 옵션과

ONLINE 옵션을 지원합니다.

비활성화되어 있는 클러스터형 인덱스는 삭제할 수 없으며, 대형개체데이터(LOB)가 포함된

클러스터형 인덱스의 경우에는 ONLINE 옵션을 사용할 수 없습니다.

DROP INDEX IX_Cluster
ON Sales.Customer
WITH (ONLINE = ON, MAXDOP = 3)


클러스터형 인덱스 데이터 위치재조정
클러스터형 인덱스를 삭제하는 경우에는, MOVETO 옵션을 사용하여 리프 페이지에 저장된

데이터 행을 저장할 위치를 지정할 수 있습니다. 클러스터형 인덱스가 삭제되면, 데이터는

지정된 위치에 테이블로 다시 생성됩니다. 데이터를 저장할 대상 위치로 파티션 스키마나

파일그룹을 지정할 수도 있습니다.

DROP INDEX IX_Cluster
ON Sales.Customer
WITH (MOVE TO NewCustomerScheme)


인덱스 조각화 관리

초기에는, 인덱스에 포함된 데이터는 기존 테이블의 행 순서에 따라 잘 정렬되어 저장됩니다. SQL Server 2005 데이터베이스 엔진에서는 테이블에 행이 삽입, 변경, 삭제될 때마다 자동적

으로 인덱스를 변경합니다. 하지만, 테이블의 데이터가 변경되는 것처럼, 데이터베이스

파일에 저장된 물리적인 저장위치가 변경되는 것은 아닙니다. 테이블의 데이터가 변경되면,

인덱스가 실제 테이블의 물리적인 행 순서와 일치하지 않으며, 결국 성능저하를 일으키는

원인이 될 수 있습니다. 이러한 현상을 조각화라고 합니다. 결과적으로, 조각화를 제거하기

위해 인덱스에 대해 재조직화 또는 재생성작업을 수행해야 합니다.

재조직화(defrag) vs 재생성(rebuild)
인덱스의 조각화정도에 따라 인덱스를 재조직화할 것인지, 재생성할 것인지를 결정하게 됩니다. 클러스터형 인덱스 또는 비클러스터형 인덱스를 재조직화하게 되면, 인덱스의 리프노드의 조각화를 제거하고, 인덱스에 설정된 채우기비율(Fillfactor)에 따라 내부노드의 정보를

정리하게 됩니다. 이러한 조각모음 작업결과, 그동안 행 삭제 및 변경으로 인해 발생한

빈공간을 제거하기 때문에, 인덱스는 그만큼 더 작게 축소되며, 실제 테이블과 동일한 순서로

리프 노드가 재정렬됩니다. 인덱스 재조직화작업은 테이블에 포함된 대량개체컬럼(LOB)도

정리하게 됩니다.

인덱스의 조각화정도가 매우 극심한 경우에는 인덱스를 재생성하는 것이 바람직합니다.

인덱스 재생성작업은 인덱스를 삭제했다가 다시 생성합니다. 인덱스를 재생성하는 경우,

채우 기비율과 같은 인덱스 관련 설정을 변경할 수 있습니다. 인덱스 재조직화의 경우는,

이러한 인덱스 관련 설정을 변경할 수 없습니다.

조각화 정보 수집
인덱스를 재생성하거나 재조직화하는 작업은 상당한 비용과 자원을 소모하는 작업입니다.
인덱스 재생성작업이 인덱스 재조직화 작업에 비해 더 높은 비용을 소모합니다 그러므로,

인덱스의 조각화정보를 조사하여 반드시 필요한 경우에만 인덱스 재생성작업을 수행하는

것이 바람직합니다. sys.dm_db_index_physical_stats 함수를 사용하여,

인덱스의 조각화정도를 수집할 수 있습니다.

다음 예제는 현재 데이터베이스내의 모든 테이블에 대해서 인덱스 조각화정보를 수집하기

위해, sys.dm_db_index_physical_stats 함수를 사용하는 방법을 나타내고 있습니다.

SELECT TableName, IndexName, AvgFragmentation
FROM sys.dm_db_index_physical_stats(DEFAULT,‘ *’, DEFAULT,‘ DETAILED’)


sys.dm_db_index_physical_stats 함수에 전달되는 매개변수는 순서에 따라 다음과 같습니다.

    @TableName. 정보를 수집할 테이블을 지정합니다. 특정 테이블의 이름을 지정할 수도

       있고, DEFAULT, NULL 을 지정할 수도 있습니다. DEFAULT 또는 NULL이 지정되면,

       sys.dm_db_index_physical_stats 함수는 현재 데이터베이스의 모든 테이블에 대한 정보를

       반환합니다.

    @IndexName. 정보를 수집할 인덱스를 지정합니다. 특정 인덱스의 이름을 지정할 수도

       있고, DEFAULT, NULL,‘ *’를 지정할 수도 있습니다. DEFAULT와 NULL이 지정되면, 기본

       테이블에 대한 정보(또는 클러스터형 인덱스에 대한 정보)만 반환합니다.
       ‘*’이 지정되면, 테이블에 존재하는 모든 인덱스에 대한 정보가 반환됩니다.

    @PartitionId. 인덱스의 분할파티션 ID 번호를 지정합니다. DEFAULE, NULL,0 으로 지정

       되면 모든 분할파티션에 대한 정보가 반환됩니다.

    @Mode. 요청된 정보를 수집하기 위한 스캔 수준을 지정합니다. LIMITED 옵션을 사용할

       것을 권고하며, 부모-수준의 페이지만 읽기 때문에 매우 빠르게 작업을 수행할 수

       있습니다. SAMPLED 옵션이 지정되면, 부모-수준의 페이지와 샘플링된 리프 페이지를

       읽게 되며, DETAILED 옵션이 지정되면, 부모-수준의 페이지와 모든 리프 페이지를 읽게

       됩니다.


sys.dm_db_index_physical_stats 함수에 대한 좀 더 자세한 정보는, SQL Server 2005 온라인

도움말의 T-SQL 참조 부분을 참조하십시오.


* 출처 : DB 가이드 넷(http://www.dbguide.net/sql2005_admin_guide/sql2005_admin_guide_06.jsp)

728x90

김정선의 좋은 글을 찾아서……
SQL Server 인덱스 구성 전략(시리즈-1. 소개)

 

 

사용자 삽입 이미지
김정선(jskim@feelanet.com)

필라넷 DB사업부 수석컨설턴트

SQLServer 아카데미/트라이콤 교육센터 강사

 

Microsoft SQL Server MVP

MCT/MCITP/MCDBA



저자: SQL Server Query Processing Team 블로그

원본: 원본 아래와 같이 9개의 포스트입니다만, 번역 주제별 나누어 4개의 포스트 올리겠습니다.

 

( 번째-소개)

http://blogs.msdn.com/sqlqueryprocessing/archive/2006/11/08/index-build-strategy-in-sql-server-introduction-i.aspx

http://blogs.msdn.com/sqlqueryprocessing/archive/2006/11/09/index-build-strategy-in-sql-server-introduction-ii.aspx


(두 번째-일반 인덱스)

http://blogs.msdn.com/sqlqueryprocessing/archive/2006/11/20/index-build-strategy-in-sql-server-part-1-offline-serial-no-partitioning.aspx

http://blogs.msdn.com/sqlqueryprocessing/archive/2006/12/11/index-build-strategy-in-sql-server-part-2-offline-parallel-no-partitioning.aspx

http://blogs.msdn.com/sqlqueryprocessing/archive/2006/12/13/index-build-strategy-in-sql-server-part-2-offline-parallel-no-partitioning-non-stats-plan-no-histogram.aspx


(세 번째-정렬된 파티션 인덱스)

http://blogs.msdn.com/sqlqueryprocessing/archive/2007/01/16/index-build-strategy-in-sql-server-part-3-offline-serial-parallel-partitioning.aspx

http://blogs.msdn.com/sqlqueryprocessing/archive/2007/01/19/index-build-strategy-in-sql-server-part-3-offline-serial-parallel-partitioning-aligned-partitioned-parallel-index-build.aspx


(네 번째-정렬되지 않은 파티션 인덱스)

http://blogs.msdn.com/sqlqueryprocessing/archive/2007/05/08/index-build-strategy-in-sql-server-part-4-1-offline-serial-parallel-partitioning-non-aligned-partitioned-parallel-index-build.aspx

http://blogs.msdn.com/sqlqueryprocessing/archive/2007/05/13/index-build-strategy-in-sql-server-part-4-2-offline-serial-parallel-partitioning-non-aligned-partitioned-index-build.aspx

 



 

역자 서문

이번엔, Query Processing Team 블로그에 올라온 포스트입니다. 역시 좀 지난 글이긴 하지만 내용이 너무 좋습니다. 에전에 한 번 제목만 보고 스~윽 지나쳤던 글인데, 다시 보니 다른 곳에서는 보기 힘든 유용한 내용들로 소개되고 있었습니다.

 

사실 저로서도 조금 힘들만큼 어려운 내용들을 설명하고 있습니다. 모호한 내용도 있는 것 같습니다. 직접적으로 확인하기 어려운 내용이기도 하구요. SQL Server 인덱스에 대해서 자세히 모른다면 이 내용을 읽고 이해하기가 쉽지는 않을 것입니다

 

그런데 왜 이 포스트 시리즈를 선택했냐구요?

SQL Server가 인덱스를 어떻게 만드는지? 병렬 처리를 어떻게 하는지? 얼만큼의 메모리와 디스크를 요구하는지? 파티션 테이블과 인덱스는 또 어떻게 처리되는지? 정렬된 파티션 인덱스와 그렇치 않은 경우에는 또 어떻게 달라지는지? 그래서 어떻게 작업하는 것이 상황 별로 가장 좋을지에 대한 중요한 힌트를 얻을 수는 내용들이 포함되어 있습니다.

 

그 결론만 참고하셔도 실무에서 아주 유용하게 활용될 수 있는 내용입니다.

 

앞에서 분류된 대로, 9개의 포스트를 주제별로 묶어서 4개의 글로 올리겠습니다.

 

시리즈-1. 소개

시리즈-2. 일반 인덱스

시리즈-3. 정렬된(Aligned) 파티션 인덱스

시리즈-4. 정렬되지(Non-aligned) 않은 파티션 인덱스

 

그럼, 우선 소개 부분부터 올립니다.

 

 

소개(I)

SQL Server의 인덱스 구성 전략은 사용자의 요구에 따라 다양하다. 그 전략에 따라 서로 다른 메모리와 디스크 공간을 요구한다. 이러한 전략들에 대해서 살펴볼 것이다.

 

우선 SQL Server 2005의 어떤 종류의 인덱스 구성 방식이 있는 보자.

 

 

온라인 인덱스 구성 vs. 오프라인 인덱스 구성

SQL Server 2005에서는 온라인으로 인덱스의 만들기, 재구성, 삭제 작업이 가능하다. ONLINE 옵션은 이러한 인덱스 작업을 수행하는 동안에도 사용자가 테이블이나 클러스터형(Clustered) 인덱스와 관련된 비클러스터형(Nonclustered) 인덱스에 접근하는 것이 허용한다. 오프라인으로 클러스터형 인덱스를 구성하거나 재구성하는 등의 DDL 작업을 하면 이는 해당 데이터와 관련 인덱스에 배타적 잠금을 보유하게 되고 이로 인해 다른 사용자가 데이터나 인덱스에 접근하지 못하도록 방해하게 된다.

 

Example:

Create index idx_t ON t(c1, c2)

WITH (ONLINE = ON)

 

 

직렬 인덱스 구성 vs. 병렬 인덱스 구성

다중 프로세서를 가진 컴퓨터에서 인덱스 구문 또한 다른 쿼리를 실행할 때처럼, 스캔, 정렬, 그리고 구성 작업을 수행하는데 병렬 처리가 가능하다. 병렬 처리 수는 최대 병렬 처리 수(sp_configure로 설정한), MAXDOP 인덱스 옵션, 현재 작업부하의 크기, 파티션되지 않은 경우, 첫 번째 키 칼럼의 데이터 분포등에 의해서 결정될 수 있다.

 

Example:

Create index idx_t ON t(c1, c2)

WITH (MAXDOP = 2)

-- 인덱스 구성에 2개의 프로세서 사용

 

 

사용자 데이터베이스 사용 vs. tempdb 사용

인덱스 구성/재구성 작업 시 일반적으로 중간 단계에서 생성되는 정렬 결과를 저장하기 위해서 해당 사용자 데이터베이스를 사용하거나 tempdb 데이터베이스를 사용할 수 있다. 후자의 경우 SORT_IN_TEMPDB 인덱스 옵션으로 지정할 수 있다. 디폴트로 OFF로 설정되면, 정렬 결과는 해당 파일 그룹이나 파티션 스킴(scheme)에 저장된다.

(역주: 뒤에서 논의하겠지만, 직렬/병렬, 파티션/일반 테이블 등등의 따라서 이 옵션의 사용으로 인한 영향력은 달라지게 된다. 따라서 관심 있는 살펴볼 필요가 있는 옵션이다)

 

Example:

Create clustered index idx_t ON t(c1)

WITH (SORT_IN_TEMPDB = ON)

 

 

 

소개(II)

 

파티션(Partitioned) 인덱스 구성 vs. 일반 인덱스(Nonpartitioned) 구성

파티션 테이블과 인덱스는 데이터를 하나 이상의 파일 그룹으로 분리시켜 저장한다. 데이터가 수평 분할이 되므로, 행 그룹 단위로 개별 파티션(분할)에 놓이게 된다. 해당 테이블과 인덱스 데이터에 대해 쿼리나 수정이 일어날 때는 하나의 테이블로서 다루어진다. 단일 인덱스와 테이블에 모든 파티션은 동일 데이터베이스에 존재해야 한다.

 

정렬된 파티션 인덱스 구성하기:

파티션 인덱스가 종속된 해당 테이블과는 별도로 구현될 수 있지만, 일반적으로는 파티션 테이블을 설계하고 나서 그 테이블에 인덱스를 생성하는 것이 적합하다. 이 경우 SQL Server는 인덱스를 구성할 때 자동적으로 해당 테이블과 동일한 파티션 스킴과 파티션 열을 사용해서 파티션 인덱스로 만들어준다. 그 결과 테이블과 동일한 방식의 파티션 되는 것이다. 이것이 테이블과 인덱스가 정렬(Aligned, 혹은 맞춤)되는 것이다.

 

인덱스가 반드시 해당 테이블과 동일한 이름의 파티션 함수를 사용할 필요는 없다. 그러나, 다음 항목들은 동일해야 한다

-       파티션 함수의 인수는 동일 데이터 형식

-       동일 파티션 수

-       동일한 파티션 경계 값

 

또한 파티션 테이블 혹은 클러스터형 인덱스 상에서 비클러스터형 인덱스를 구성하면 파티션 함수를 지정하지 않아도 정렬된 파티션으로 구성된다.

 

Example:

Create Partition Function pf (int)

as range right for values (NULL,  1,  100)

                   

Create Partition Scheme ps

as Partition pf

TO ([PRIMARY], [FileGroup1], [FileGroup1], [FileGroup1])

                   

Create table t (c1 int, c2 int)

on ps(c1)

                   

Create Index idx_t on t(c1)

 

 

일반 인덱스(파티션되지 않은) 구성:

인덱스 생성 시 다른 파티션 스킴이나 개별 파일 그룹을 지정하면 테이블에 정렬되지 않은 인덱스로 만들어진다. 일반 테이블에 파티션 클러스터형 인덱스를 만들어서 파티션 테이블로 바꿀 수도 있다. 물론 이 경우 정렬 인덱스를 아니다.

 

Example:

Create Partition Function pf (int)

as range right for values (NULL,  1,  100)

                   

Create Partition Scheme ps

as Partition pf

TO ([PRIMARY], [FileGroup1], [FileGroup1], [FileGroup1])

                   

Create table t (c1 int, c2 int)

                   

Create clustered Index idx_t on t(c1)

on ps(c1)

 

참고. 기존 파티션 클러스터형 인덱스를 삭제하는 경우, 새로운 Heap 테이블은 그대로 파티션 상태로 남게되는 것이며 동일 파티션 스킴이나 파일 그룹에 위치하는 것이다. 이 경우 원한다면 MOVE TO 옵션을 사용해서 그 위치를 조정할 수 있다.

 

Example:

Drop Index idx_t on t

WITH(MOVE TO new_ps(c1))

 

----------------------------------------------------

여기까지입니다.

소개 부분이라 특별한 이슈는 보이지 않으시죠? 준비 운동 정도로 생각하셔도 될 듯.


다음 주제는,

시리즈-2. 일반 인덱스

입니다. 기다려 주세요~~~

+ Recent posts