В чем разница между функциями RANK() и DENSE RANK() в oracle?


в чем разница между RANK() и DENSE_RANK() функции? Как узнать N-ю зарплату в следующем emptbl таблицы?

DEPTNO  EMPNAME    SAL
------------------------------
10       rrr    10000.00
11       nnn    20000.00
11       mmm    5000.00
12       kkk    30000.00
10       fff    40000.00
10       ddd    40000.00
10       bbb    50000.00
10       ccc    50000.00

если в таблице данных, имеющих nulls что будет, если я хочу узнать nth зарплату?

7 97

7 ответов:

ранг дает вам рейтинг в вашем упорядоченном разделе. Связи присваиваются один и тот же ранг, при этом следующий рейтинг(ы) пропускается. Таким образом, если у вас есть 3 предмета в ранге 2, следующий ранг будет ранжирован 5.

DENSE_RANK снова дает вам рейтинг в вашем упорядоченном разделе, но ряды являются последовательными. Никакие ранги не пропущены, если есть ранги с несколькими элементами.

что касается нулей, то это зависит от предложения ORDER BY. Вот простой тестовый скрипт, который вы можете играть чтобы увидеть, что происходит:

with q as (
select 10 deptno, 'rrr' empname, 10000.00 sal from dual union all
select 11, 'nnn', 20000.00 from dual union all
select 11, 'mmm', 5000.00 from dual union all
select 12, 'kkk', 30000 from dual union all
select 10, 'fff', 40000 from dual union all
select 10, 'ddd', 40000 from dual union all
select 10, 'bbb', 50000 from dual union all
select 10, 'xxx', null from dual union all
select 10, 'ccc', 50000 from dual)
select empname, deptno, sal
     , rank() over (partition by deptno order by sal nulls first) r
     , dense_rank() over (partition by deptno order by sal nulls first) dr1
     , dense_rank() over (partition by deptno order by sal nulls last) dr2
 from q; 

EMP     DEPTNO        SAL          R        DR1        DR2
--- ---------- ---------- ---------- ---------- ----------
xxx         10                     1          1          4
rrr         10      10000          2          2          1
fff         10      40000          3          3          2
ddd         10      40000          3          3          2
ccc         10      50000          5          4          3
bbb         10      50000          5          4          3
mmm         11       5000          1          1          1
nnn         11      20000          2          2          2
kkk         12      30000          1          1          1

9 rows selected.

вот ссылка к хорошему объяснению и некоторым примерам.

вот эта статья хорошо объясняет. по сути, вы можете смотреть на это так:

CREATE TABLE t AS
SELECT 'a' v FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'b'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'd'   FROM dual UNION ALL
SELECT 'e'   FROM dual;

SELECT
  v,
  ROW_NUMBER() OVER (ORDER BY v) row_number,
  RANK()       OVER (ORDER BY v) rank,
  DENSE_RANK() OVER (ORDER BY v) dense_rank
FROM t
ORDER BY v;

вышеизложенное даст:

+---+------------+------+------------+
| V | ROW_NUMBER | RANK | DENSE_RANK |
+---+------------+------+------------+
| a |          1 |    1 |          1 |
| a |          2 |    1 |          1 |
| a |          3 |    1 |          1 |
| b |          4 |    4 |          2 |
| c |          5 |    5 |          3 |
| c |          6 |    5 |          3 |
| d |          7 |    7 |          4 |
| e |          8 |    8 |          5 |
+---+------------+------+------------+

по словам

  • ROW_NUMBER() присваивает уникальное значение каждой строке
  • RANK() приписывает один и тот же номер строки к одному и тому же значению, оставляя "дыры"
  • DENSE_RANK() приписывает один и тот же номер строки к одному и тому же значению, не оставляя "дыр"
SELECT empno,
       deptno,
       sal,
       RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          4
      7499         30       1600          5
      7698         30       2850          6


SELECT empno,
       deptno,
       sal,
       DENSE_RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          3
      7499         30       1600          4
      7698         30       2850          5

ранг(): он используется для ранжирования записи в группе строк.

dense_rank () : функция DENSE_RANK действует как функция RANK, за исключением того, что она присваивает последовательные ранги.

запрос -

select 
    ENAME,SAL,RANK() over (order by SAL) RANK
from 
    EMP;

выход -

+--------+------+------+
| ENAME  | SAL  | RANK |
+--------+------+------+
| SMITH  |  800 |    1 |
| JAMES  |  950 |    2 |
| ADAMS  | 1100 |    3 |
| MARTIN | 1250 |    4 |
| WARD   | 1250 |    4 |
| TURNER | 1500 |    6 |
+--------+------+------+

запрос -

select 
    ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from 
    EMP;

выход -

+--------+------+-----------+
| ENAME  | SAL  |  DEN_RANK |
+--------+------+-----------+
| SMITH  |  800 |         1 |
| JAMES  |  950 |         2 |
| ADAMS  | 1100 |         3 |
| MARTIN | 1250 |         4 |
| WARD   | 1250 |         4 |
| TURNER | 1500 |         5 |
+--------+------+-----------+
select empno
       ,salary
       ,row_number() over(order by salary desc) as Serial
       ,Rank() over(order by salary desc) as rank
       ,dense_rank() over(order by salary desc) as denseRank
from emp ;

Row_number() -> используется для генерации серийного номера

Dense_rank() даст непрерывный ранг, но ранг будет пропускать ранг в случае столкновения ранга.

единственное различие между функциями RANK() и DENSE_RANK() заключается в случаях, когда существует "связь"; т. е. в случаях, когда несколько значений в наборе имеют одинаковый рейтинг. В таких случаях, ранг() присвоит номера-подряд "ряды" значения в наборе (в результате чего зазоры между целочисленного ранжирования ценностей, когда есть галстук), в то время как DENSE_RANK() будет назначать последовательные ряды для значений в наборе (так что не будет никаких зазоров между целочисленного ранжирования ценностей в случае галстук.)

например, рассмотрим множество {25, 25, 50, 75, 75, 100}. Для такого набора RANK () вернется {1, 1, 3, 4, 4, 6} (Обратите внимание, что значения 2 и 5 пропускаются), тогда как DENSE_RANK() вернет {1,1,2,3,3,4}.

Rank() функция SQL генерирует ранг данных в пределах упорядоченного набора значений, но следующий ранг после предыдущего ранга является row_number этой конкретной строки. С другой стороны, функция DENSE_RANK () SQL генерирует следующий номер вместо генерации row_number. Ниже приведен пример SQL, который прояснит понятие:

Select ROW_NUMBER() over (order by Salary) as RowNum, Salary, 
RANK() over (order by Salary) as Rnk, 
DENSE_RANK() over (order by Salary) as DenseRnk from (
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 2000 as Salary union all
Select 3000 as Salary union all
Select 3000 as Salary union all
Select 8000 as Salary union all
Select 9000 as Salary) A

Он будет генерировать следующий вывод:

----------------------------
RowNum  Salary  Rnk DenseRnk
----------------------------
1       1000    1   1
2       1000    1   1
3       1000    1   1
4       2000    4   2
5       3000    5   3
6       3000    5   3
7       8000    7   4
8       9000    8   5