반응형


안녕하세요


오늘은 SQL 마지막 포스팅으로


SQL에 특화된 프로그래밍 언어인

PL/SQL에 대해 알아보도록 하겠습니다!



PL/SQL이란?


SQL을 확장한 절차적 언어로

관계형 데이터베이스에서 사용되는 Oracle의 표준 데이터 엑세스 언어입니다.


그렇다면 PL/SQL을 왜 배워야 할까요?


우선 큰 규모의 화사는 데이터를 대부분 오라클에 저장합니다.


하지만

SQL만으로 데이터를 분석하고 처리하려면 많은 노력이 수반됩니다.



PL/SQL을 사용하면 아래와 같은 장점이 있습니다.



 1. PL/SQL을 이용하면 SQL로 반복해서 해야하는 작업을

보다 단순하게 처리할 수 있습니다.


2. R로 데이터 분석을 하기위해 엑셀 등으로

DB의 데이터를 내려받아 분석하는 것이 아니라,

바로 DB에서 PL/SQL을 이용해서 분석할 수 있습니다.


3. SQL 튜닝 방법 중 하나로 PL/SQL을 사용할 수 있습니다.





PLSQL 기본구조


 

     declare

                선언문 (변수, 예외, 커서 등을 선언한다.)

     

     begin

                실행절 (SQL 문, IF 문, LOOP 문 등을 실행한다.)


     end;

/





예제를 통해 활용해보도록 합시다!


[예제를 위한 테이블]


[ emp ] : 사원테이블


사원명

사원번호

직업

연봉 

부서

 A

1001

 MANAGER

 3000

 파주

 B

1002

 SALESMAN

 1600

 제주

 C

1005

 PRESIDENT

 5000

 서울

 D

1024

 SALESMAN

 1400

 파주

 E

2024

 ANALYST

 3000

 서울 

 F

2215

 SALESMAN

 1350

 서울

 G

2015

 MANAGER

 2900

 일산

 H

1240

 ANALYST

 3000

 파주

 I

3415

 SALESMAN

 1700

 서울




예제1. 사원번호를 입력하면 해당 사원의 월급에 대한 순위가 출력되게 하시오

(단, 없는 사원번호를 입력하였을 때 예외처리를 하시오)



설명)


1. set serveroutput on 을 사용하여 데이터를 출력하는 dbms_output.put_line함수를 이용할 수 있다.


2. accept는 데이터를 입력받기 위한 것으로

&치환변수를 이용하여 값을 입력받는다.


3. exception이란 예외처리하는 것으로

no_data_found란 데이터가 없을 때 발생하는 오류로

오라클에서 지정해 놓은 예외처리 방법 중 하나이다.




예제2. 직업을 입력하면 해당 직업의 토탈월급이 출력되는 함수를 생성하고 실행하시오.



설명)


1. create를 이용하여 함수를 생성한다.


2. 가로의 값은 입력받을 파라미터를 지정하는 것이다.


3. return 값이 꼭 존재해야하며,

여기서는 v_sumsal의 타입인 number로 지정한다.



사용방법)


SQL> SELECT 사원명, 직업, job_sal_sum('SALESMAN') FROM emp;




예제3. 직업, 부서별 토탈월급을 출력하시오

(PL/SQL 프로시져를 이용하세요)



우선 SQL을 이용하면 아래와 같습니다.



SQL> SELECT  직업, sum( decode(부서, '서울', 연봉, 0) ) "서울",

sum( decode(부서, '파주', 연봉, 0) ) "파주",

sum( decode(부서, '일산', 연봉, 0) ) "일산"

FROM emp

GROUP BY 직업;




[결과]


 직업

 서울

 파주

 일산

 MANAGER

 

 3000

 2900

 SALESMAN

 3050

 1400

 

 PRESIDENT

 5000

 

 

 ANALYST

 3000

 3000

 




사용방법)


SQL1> variable v_result1 refcursor;


SQL2> exec job_dept(:v_result1);


SQL3> print v_result3;



설명)


프로시져란 PLSQL 코드를 database에 저장하기 위한 것으로

함수와 달리 return절이 없으며 결과를 반드시 출력하지 않아도 됩니다.


1. 연결 연산자와 함수를 이용하여 SQL문을 완성합니다.


2. 만약 부서가 위의 테이블보다 훨씬 많이 존재한다고 가정한다면,


for loop문을 이용하여 만든 PLSQL문이 보다 효율적이며,

부서가 추가되었을 때에도 코드를 수정하지 않아도 된다는 장점이 있습니다.





PL/SQL을 간단히 다뤄보았습니다!


더 궁금한 점이 있다면 댓글로 남겨주세요~


반응형
반응형

안녕하세요


오늘은 서브쿼리 튜닝으로 돌아왔습니다.



서브쿼리 튜닝의 종류는 정말 다양합니다.



하지만!


이번 포스팅에서는


가장 중요한 두 가지!


merging과 unnesting에 대해 다뤄보도록 하겠습니다.






NO_MERGE     vs     NO_UNNEST



 NO_MERGE: 뷰나 인라인 뷰에 사용


(인라인 뷰 = FROM절의 서브쿼리)



NO_UNNEST: 인라인 뷰 외의 WHERE절 등의 서브쿼리에 사용




 NO_MERGE와 NO_UNNEST의 공통점은


서브쿼리 또는 뷰나 인라인 뷰 )

를 해체하지 말아라. 


라는 의미를 갖고 있습니다.



그럼 그 반대도 있겠죠?




 MERGE: 뷰나 인라인 뷰를 해체해라



UNNEST: 서브쿼리를 해체해라


(해쉬 테이블로 올릴 테이블을 직접 정하고자 할 때 사용)





먼저 서브쿼리 UNNESTING 문부터 알아보죠!



[짝꿍처럼 써줘야하는 힌트]



 NO_UNNEST: 서브쿼리를 해체하지 마라


1. PUSH_SUBQ: 서브쿼리부터 수행해라

2. NO_PUSH_SUBQ: 메인쿼리부터 수행해라


UNNEST: 서브쿼리를 해체해라


1. SWAP_JOIN_INPUT: 해쉬테이블로 올릴 테이블 지정

2.NO_SWAP_JOIN_INPUT: 해쉬테이블로 올리지 않을 테이블 지정




예제를 위한 테이블


[ emp ] : 사원테이블


사원명

나이

직업

연봉 

주소

 A

 35

 NULL

 NULL

 파주

 B

 34

 SALESMAN

 1600

 제주

 C

 38

 PRESIDENT

 5000

 서울

 D

 36

 SALESMAN

 1400

 파주

 E

 39

 ANALYST

 3000

 서울 

 F

 32

 SALESMAN

 1350

 서울

 G

 37

 MANAGER

 2850

 일산

 H

 35

 ANALYST

 3000

 파주

 I

 36

 SALESMAN

 1700

 서울



[ address ] : 주소테이블


주소 

 관할부서

 서울

 한국 A

 일산

 한국 B

 파주

 한국 C

 제주

 한국 D



예제1. 관할 부서가 한국A인 사원들의 이름, 직업, 연봉을 출력하세요.(서브쿼리로)




[결과]


사원명

직업

연봉 

주소

 C

 PRESIDENT

 5000

 서울

 E

 ANALYST

 3000

 서울 

 F

 SALESMAN

 1350

 서울

 I

 SALESMAN

 1700

 서울




다음으로 서브쿼리 MERGING 문을 알아보죠!




 MERGE: 뷰나 인라인 뷰를 해체해라


NO_MERGE: 뷰나 인라인 뷰를 해체하지 마라

 



예제2. 직업이 SALESMAN과 관련된 데이터만 들어있는 뷰를 생성하고 

그 뷰에서

관할부서가 한국A인 사원들의 이름, 직업, 연봉, 관할부서를 출력하세요.




사원 테이블이 1억건이고 그 중에 SALESMAN이 10건 있다고 가정하면


VIEW를 해체하지 않고 주소테이블과 조인하는 것이 더 효율적입니다.


[결과]


사원명

직업

연봉 

관할부서

 C

 PRESIDENT

 5000

 한국 A

 E

 ANALYST

 3000

 한국 A

 F

 SALESMAN

 1350

 한국 A

 I

 SALESMAN

 1700

 한국 A




오늘은 여기까지!


서브쿼리문을 실행할 때, 서브쿼리문으로 실행할 지,

아니면 조인의 형태로 변경해서 실행할지,


쿼리변환기를 제어하는 기술을 알아보았습니다!



다음엔 PLSQL을 약간 다뤄보겠습니다!

반응형
반응형

오랜만에 돌아왔네요!





이전 포스팅과 이어지는


조인튜닝 2번째탄을 갖고왔습니다!


오늘은 알아두면 좋은 조인 튜닝 방법에 대해 알아보죠!



조인 튜닝시에 가장 중요한 2가지


1. 조인 순서


 

(1) ordered: FROM 절에서 기술한 테이블 순서대로 조인


(2) leading: leading힌트 안에  테이블 순서대로 조인



2. 조인 방법



(1) use_nl: nested loop 조인


(2) use_hash: hash loop 조인


(3) use_merge: sort merge loop 조인


(4) outer join







nested loop 조인 vs hash loop 조인


nested loop join이란 중첩된 조인 방법으로

두개의 테이블을 조인할 때 한 건, 한 건씩 순차적으로 반복해서 조인하는 방법입니다.


단, 조인되는 건수가 작을 때 유리한 조인 방법입니다!



hash 조인이란 데이터가 적은 테이블을 메모리에 올려두고

해쉬함수를 이용해 두번째 테이블과의 조인을 시도하는 방법입니다.


메모리가 속도가 훨씬 빠르기때문에 대용량 데이터의 경우,

해쉬조인을 하면 속도가 굉장히 빨라집니다.


단, 메모리를 많이 이용하는 방법은 협업시

다른 사람의 쿼리 속도를 늦출 수 있습니다.




먼저 해쉬조인의 원리부터 파악해봅시다!



해쉬조인을 할 때 두개의 테이블은

해쉬테이블prob(탐색) 테이블로 나뉩니다.



 

          (1) 해쉬테이블이란?


메모리로 올라가는 테이블


          (2) 탐색테이블이란? 


                  디스크에서 메모리에 있는 해쉬테이블과 조인하는 테이블





예제를 위해 사용할 테이블


[ 고객 테이블 ]


고객이름

 나이

  주소 

 총구매액

 추천인

 A

 24

 서울

 30000

 null

 B

 29

 서울

 10000

 A

 C

 26

 파주

 25000

 A

 D

 27

 null

 1000

 B

 E

 25

 서울

 20000 C
 F 30 일산

 25000

 B



[ 주소 테이블 ]


주소 

 관할부서

 서울

 한국 A

 일산

 한국 B

 파주

 한국 C

 제주

 한국 D




예제1. 고객이름, 주소, 관할부서, 총구매액을 알고 싶습니다.

해쉬조인을 사용하여 두개의 테이블을 조인하세요.





[결과]


 고객이름

 주소

 관한부서

 총구매액

 A

 서울

 한국A

 30000

 B

 서울

 한국A

 10000

 C

 파주

 한국C

 25000

 F

 일산

 한국B

 25000

 E

 서울

 한국A

 20000



/*+ leading(a c) use_hash(c) */와 같이 힌트를 사용하면 됩니다.


아마 힌트를 주지 않아도 옵티마이저가 알아서 hash조인을 하는 경우도 있지만


이러한 힌트를 명시해주는 것이 바람직합니다.


여기서 잠깐!

힌트 사용시 별칭을 이용해야합니다!


예를 들어 아래와 같이 해쉬조인 사용시 힌트를 이용할 수 있습니다.



hash join 사용 힌트



(1) Use_hash(테블명)해쉬조인하라는 힌트


(2) Swap_join_inputs: 해쉬테이블을 선정할때 사용하는 힌트


(3)No_swap_join: prob테이블을 선정할 때 사용하는 힌트


(4) parallel(a, b) : 해쉬조인시 병렬작업하는 힌트





예제2. 이름, 관할부서를 출력하는 OUTER 문장을 작성하는데

주소가 null인 고객D가 출력되게 해쉬조인하세요

(단, 주소 테이블에서 고객테이블 순으로)




혹시 leading을 쓰셨나요?


조인할 때 outer join 사인을 사용하면 join 순서는 무조건 outer join 사인이 없는 쪽에서 먼저 조인이 됩니다. 



따라서


/*+ swap_join_inputs(a) use_hash(c) */ 를 사용해야

아래와 같은 실행계획을 얻을 수 있습니다.



[결과]


 고객이름

 관한부서

 A

 한국A

 B

 한국A

 C

 한국C

 D null

 F

 한국B

 E

 한국A




예제3. 고객이름, 주소, 관할부서를 출력하는데

해쉬조인 문장으로 병렬처리해서 출력하세요.



/*+ leading(a c) use_hash(c) full(a) full(c) 

parallel(a, 4) parallel(c, 4) */ 

과 같이 병렬처리를 하는 이유는 보다 빠른 쿼리 속도를 위해서 입니다.


hash join시 무조건 table access full을 해야합니다.




참고) non-equi-join의 경우 해쉬조인을 쓸수 없습니다.


하지만 대용량 테이블이어서 hash조인을 사용할 수 밖에 없을 때
sort merge 조인 이용할 수 있습니다.
(물론 병렬처리도 가능하겠죠?)


방법은 예제 1번에서 use_hash대신에 use_merge를 넣는 것입니다!

쉽죠?



지금까지 간단한 방법으로

조인의 쿼리속도를 빠르게하는 방법을 알아보았습니다.


다음 포스팅은 서브쿼리 튜닝입니다!!

반응형
반응형



인덱스 튜닝보다 더 중요한 조인 튜닝! 


조인은 두개 이상의 이상의 테이블을 스캔하기때문에

더 많은 시간이 걸립니다.


오라클 조인을 모른다면 여기부터!



오늘은


2번에 걸쳐 조인튜닝에 대해 다뤄보도록 하겠습니다.


조인 튜닝시에 가장 중요한 2가지


1. 조인 순서


 

(1) ordered: FROM 절에서 기술한 테이블 순서대로 조인


(2) leading: leading힌트 안에 테이블 순서대로 조인



2. 조인 방법



(1) use_nl: nested loop 조인


(2) use_hash: hashe loop 조인


(3) use_merge: sort merge loop 조인





오늘은 1. 조인 순 2가지 방법에 대해 알아봅시다!



오늘도 역시 예제를 위한 테이블 먼저 보고 갑시다!


[ 고객 테이블 ]


고객이름

 나이

  주소 

 총구매액

 추천인

 A

 24

 서울

 30000

 null

 B

 29

 서울

 10000

 A

 C

 26

 파주

 25000

 A

 D

 27

 제주

 1000

 B

 E

 25

 서울

 20000 C
 F 30 일산

 25000

 B
 G 32 파주 10000

 F

 H 23 일산 32000 A



[ 주소 테이블 ]


주소 

 관할부서

 서울

 한국 A

 일산

 한국 B

 파주

 한국 C

 제주

 한국 D




문제1. 관할부서가 한국 A인 고객들의

고객이름, 나이, 주소, 관할부서를

아래의 조건을 만족시켜서 출력하세요


(조인 순서: '주소테이블 --> 고객테이블' 순, ordered hint 사용하기)



조인 순서를 지정하는 방법 중

ordered 방법은 FROM절의 순서에 맞게

조인 순서를 지정할 수 있습니다.



문제에서 조인순서로

주소테이블을 먼저 scan하도록 지정한 이유가 무엇일까요?


row의 갯수가 적은 것을 먼저 스캔하는 것이 더 빠르기때문입니다.


 

SQL1> SELECT COUNT(*) FROM 주소 WHERE 주소 = '서울' ;


결과: 1


SQL2> SELECT COUNT(*) FROM 고객 WHERE 주소 = '서울' ;


결과: 3





문제2. 관할부서가 한국 A인 고객들의

고객이름, 나이, 주소, 관할부서를

아래의 조건을 만족시켜서 출력하세요


(조인 순서: '주소테이블 --> 고객테이블' 순, leading hint 사용하기)



문제는 같고 조인순서관련 조건만 다릅니다.



문제1과 문제2의 다른 점을 발견하셨나요?


ordered 와 leading의 가장 다른 부분은

FROM절에서 조인하는 순서에 맞추지 않아도 된다는 점입니다.


만약 조인하고자 하는 테이블이 여러개일 경우

FROM절에서 그 순서를 맞추기는 대략난감..;;


만약 데이터가 바뀌어서 COUNT를 다시 했는데 순서를 바꿔야한다?

쩝...


이때 ordered대신 leading hint를 사용하면

FROM절의 테이블 순서와 상관없이

직접 그 순서를 손쉽게 바꿀 수 있습니다. 



조인절이 궁금하다면 여기로!




오늘은 여기까지 간단하게 조인튜닝1_조인순서에 대해 알아보았습니다.


다음은 조인튜닝2_조인 방법으로 돌아오겠습니다~


Have a nice weekend



이 글이 도움되셨다면 아래 공감 꾹~ 



반응형

+ Recent posts