Руководство По Языку SQL СУБД Firebird 5.0 | Статистические Функции | CORR()

Примеры `CORR`

Example 1. Использование функции CORR

SELECT
    CORR(alength, aheight) AS c_corr
FROM measure

См. также:

[fblangref-aggfuncs-covar-pop], [fblangref-aggfuncs-stddev-pop].

`COVAR_POP()`

Доступно в

DSQL

Синтаксис

COVAR_POP(<expr1>, <expr2>)

Table 1. Параметры функции `COVAR_POP`
Параметр	Описание
expr1, expr2	Выражение возвращает числовой тип данных.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция COVAR_POP возвращает ковариацию совокупности (population covariance) пар выражений с числовыми значениями.

Функция COVAR_POP(<expr1>, <expr2>) эквивалентна

(SUM(<expr1> * <expr2>) - SUM(<expr1>) * SUM(<expr2>) / COUNT(*))
  / COUNT(*)

В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Примеры `COVAR_POP`

Example 1. Использование функции COVAR_POP

SELECT
    COVAR_POP(alength, aheight) AS c_corr
FROM measure

См. также:

[fblangref-aggfuncs-covar-samp], [fblangref-aggfuncs-sum], [fblangref-aggfuncs-count].

`COVAR_SAMP()`

Доступно в

DSQL

Синтаксис

COVAR_SAMP(<expr1>, <expr2>)

Table 1. Параметры функции `COVAR_SAMP`
Параметр	Описание
expr1, expr2	Выражение возвращает числовой тип данных.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция COVAR_SAMP возвращает выборочную ковариацию (sample covariance) пары выражений с числовыми значениями.

Функция COVAR_SAMP(<expr1>, <expr2>) эквивалентна

(SUM(<expr1> * <expr2>) - SUM(<expr1>) * SUM(<expr2>) / COUNT(*))
  / (COUNT(*) - 1)

В случае если выборка записей пустая, содержит только 1 запись или содержит только значения NULL, результат будет содержать NULL.

Примеры `COVAR_SAMP`

Example 1. Использование функции COVAR_SAMP

SELECT
    COVAR_SAMP(alength, aheight) AS c_corr
FROM measure

См. также:

[fblangref-aggfuncs-covar-pop], [fblangref-aggfuncs-sum], [fblangref-aggfuncs-count].

`STDDEV_POP()`

Доступно в

DSQL

Синтаксис

STDDEV_POP(<expr>)

Table 1. Параметры функции STDDEV_POP
Параметр	Описание
expr	Выражение возвращает числовой тип данных.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr.

Функция STDDEV_POP возвращает среднеквадратичное отклонение для группы.Значения NULL пропускаются.

Функция STDDEV_POP(<expr>) эквивалентна

SQRT(VAR_POP(<expr>))

В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Примеры `STDDEV_POP`

Example 1. Использование функции STDDEV_POP

SELECT
  dept_no,
  STDDEV_POP(salary)
FROM employee
GROUP BY dept_no

См. также:

[fblangref-aggfuncs-stddev-pop], [fblangref-aggfuncs-var-pop].

`STDDEV_SAMP()`

Доступно в

DSQL

Синтаксис

STDDEV_SAMP(<expr>)

Table 1. Параметры функции STDDEV_SAMP
Параметр	Описание
expr	Выражение возвращает числовой тип данных.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr

Функция STDDEV_SAMP возвращает стандартное отклонение для группы.Значения NULL пропускаются.

Функция STDDEV_SAMP(<expr>) эквивалентна

SQRT(VAR_SAMP(<expr>))

В случае если выборка записей пустая, содержит только 1 запись или содержит только значения NULL, результат будет содержать NULL.

Примеры `STDDEV_SAMP`

Example 1. Использование функции STDDEV_SAMP

SELECT
  dept_no,
  STDDEV_SAMP(salary)
FROM employee
GROUP BY dept_no

См. также:

[fblangref-aggfuncs-stddev-pop], [fblangref-aggfuncs-var-samp].

`VAR_POP()`

Доступно в

DSQL

Синтаксис

VAR_POP(<expr>)

Table 1. Параметры функции `VAR_POP`
Параметр	Описание
expr	Выражение возвращает числовой тип данных.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr

Функция VAR_POP возвращает выборочную дисперсию для группы.Значения NULL пропускаются.

Функция VAR_POP(<expr>) эквивалентна

(SUM(<expr> * <expr>) - SUM(<expr>) * SUM(<expr>) / COUNT(<expr>))
  / COUNT(<expr>)

В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Примеры `VAR_POP`

Example 1. Использование функции VAR_POP

SELECT
  dept_no,
  VAR_POP(salary)
FROM employee
GROUP BY dept_no

См. также:

[fblangref-aggfuncs-var-samp], [fblangref-aggfuncs-sum], [fblangref-aggfuncs-count].

`VAR_SAMP()`

Доступно в

DSQL

Синтаксис

VAR_SAMP(<expr>)

Table 1. Параметры функции `VAR_SAMP`
Параметр	Описание
expr	Выражение возвращает числовой тип данных.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr

Функция VAR_SAMP возвращает несмещённую выборочную дисперсию для группы.Значения NULL пропускаются.

Функция VAR_SAMP(<expr>) эквивалентна

(SUM(<expr> * <expr>) - SUM(<expr>) * SUM(<expr>) / COUNT(<expr>))
  / (COUNT(<expr>) - 1)

В случае если выборка записей пустая, содержит только 1 запись или содержит только значения NULL, результат будет содержать NULL.

Примеры `VAR_SAMP`

Example 1. Использование функции VAR_SAMP

SELECT
  dept_no,
  VAR_SAMP(salary)
FROM employee
GROUP BY dept_no

См. также:

[fblangref-aggfuncs-var-pop], [fblangref-aggfuncs-sum], [fblangref-aggfuncs-count].

Функции линейной регрессии

Функции линейной регрессии полезны для продолжения линии тренда.Линия тренда — это, как правило, закономерность, которой придерживается набор значений.Линия тренда полезна для прогнозирования будущих значений.Этот означает, что тренд будет продолжаться и в будущем.Для продолжения линии тренда необходимо знать угол наклона и точку пересечения с осью Y.Набор линейных функций включает функции для вычисления этих значений.

В синтаксисе функций, у интерпретируется в качестве переменной, зависящей от х.

`REGR_AVGX()`

Доступно в

DSQL

Синтаксис

REGR_AVGX ( <y>, <x> )

Table 1. Параметры функции REGR_AVGX
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_AVGX вычисляет среднее независимой переменной линии регрессии.

Функция REGR_AVGX(<y>, <x>) эквивалентна

SUM(<exprX>) / REGR_COUNT(<y>, <x>)

<exprX> ::=
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END

См. также:

[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-regr-avgy].

`REGR_AVGY()`

Доступно в

DSQL

Синтаксис

REGR_AVGY(<y>, <x>)

Table 1. Параметры функции `REGR_AVGY`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_AVGY вычисляет среднее зависимой переменной линии регрессии.

Функция REGR_AVGY(<y>, <x>) эквивалентна

SUM(<exprY>) / REGR_COUNT(<y>, <x>)

<exprY> ::=
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <y> END

См. также:

[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-regr-avgx].

`REGR_COUNT()`

Доступно в

DSQL

Синтаксис

REGR_COUNT(<y>, <x>)

Table 1. Параметры функции `REGR_COUNT`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

BIGINT

Функция REGR_COUNT возвращает количество не пустых пар, используемых для создания линии регрессии.

Функция REGR_COUNT(<y>, <x>) эквивалентна

SUM(CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN 1 END)

См. также:[fblangref-aggfuncs-sum]

`REGR_INTERCEPT()`

Доступно в

DSQL

Синтаксис

REGR_INTERCEPT(<y>, <x>)

Table 1. Параметры функции `REGR_INTERCEPT`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_INTERCEPT вычисляет точку пересечения линии регрессии с осью Y.

Функция REGR_INTERCEPT(<y>, <x>) эквивалентна

REGR_AVGY(<y>, <x>) - REGR_SLOPE(<y>, <x>) * REGR_AVGX(<y>, <x>)

Примеры `REGR_INTERCEPT`

Example 1. Прогнозирование объёмов продаж

WITH RECURSIVE years(byyear) AS (
  SELECT 1991 FROM rdb$database UNION ALL
  SELECT byyear+1 FROM years WHERE byyear < 2020
),
s AS (
  SELECT EXTRACT(YEAR FROM order_date) AS byyear,
         SUM(total_value) AS total_value
  FROM sales GROUP BY 1
),
regr AS (
  SELECT REGR_INTERCEPT(total_value, byyear) as intercept,
         REGR_SLOPE(total_value, byyear) as slope
FROM s)
SELECT years.byyear AS byyear,
       intercept + (slope * years.byyear) AS total_value
FROM years CROSS JOIN regr

BYYEAR     TOTAL_VALUE
----------------------------
 1991        118377,35
 1992        414557,62
 1993        710737,89
 1994       1006918,16
 1995       1303098,43
 1996       1599278,69
 1997       1895458,96
 1998       2191639,23
 1999       2487819,50
 2000       2783999,77
...

См. также:

[fblangref-aggfuncs-regr-avgy], [fblangref-aggfuncs-regr-avgx], [fblangref-aggfuncs-regr-slope].

`REGR_R2()`

Доступно в

DSQL

Синтаксис

REGR_R2(<y>, <x>)

Table 1. Параметры функции `REGR_R2`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_R2 вычисляет коэффициент детерминации, или R-квадрат, линии регрессии.

Функция REGR_R2(<y>, <x>) эквивалентна

POWER(CORR(<y>, <x>), 2)

См. также:

[fblangref-aggfuncs-corr], [fblangref-scalarfuncs-power]

`REGR_SLOPE()`

Доступно в

DSQL

Синтаксис

REGR_SLOPE(<y>, <x>)

Table 1. Параметры функции `REGR_SLOPE`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_SLOPE вычисляет угол наклона линии регрессии.

Функция REGR_SLOPE(<y>, <x>) эквивалентна

COVAR_POP(<y>, <x>) / VAR_POP(<exprX>)

<exprX> :==
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END

См. также:

[fblangref-aggfuncs-covar-pop], [fblangref-aggfuncs-var-pop].

`REGR_SXX()`

Доступно в

DSQL

Синтаксис

REGR_SXX(<y>, <x>)

Table 1. Параметры функции `REGR_SXX`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Диагностическая статистика, используемая для анализа регрессии.

Функция REGR_SXX(<y>, <x>) вычисляется следующим образом:

REGR_COUNT(<y>, <x>) * VAR_POP(<exprX>)

<exprX> :==
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END

См. также:

[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-var-pop].

`REGR_SXY()`

Доступно в

DSQL

Синтаксис

REGR_SXY(<y>, <x>)

Table 1. Параметры функции `REGR_SXY`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Диагностическая статистика, используемая для анализа регрессии.

Функция REGR_SXY(<y>, <x>) вычисляется следующим образом:

REGR_COUNT(<y>, <x>) * COVAR_POP(<y>, <x>)

См. также:

[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-covar-pop].

`REGR_SYY()`

Доступно в

DSQL

Синтаксис

REGR_SYY(<y>, <x>)

Table 1. Параметры функции `REGR_SYY`
Параметр	Описание
y	Зависимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии.Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Диагностическая статистика, используемая для анализа регрессии.

Функция REGR_SYY(<y>, <x>) вычисляется следующим образом:

REGR_COUNT(<y>, <x>) * VAR_POP(<exprY>)

<exprY> :==
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <y> END

См. также:

[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-var-pop].

Примеры CORR

Примеры CORR

COVAR_POP()

Примеры COVAR_POP

COVAR_SAMP()

Примеры COVAR_SAMP

STDDEV_POP()

Примеры STDDEV_POP

STDDEV_SAMP()

Примеры STDDEV_SAMP

VAR_POP()

Примеры VAR_POP

VAR_SAMP()

Примеры VAR_SAMP

Функции линейной регрессии

REGR_AVGX()

REGR_AVGY()

REGR_COUNT()

REGR_INTERCEPT()

Примеры REGR_INTERCEPT

REGR_R2()

REGR_SLOPE()

REGR_SXX()

REGR_SXY()

REGR_SYY()

Примеры `CORR`

`COVAR_POP()`

Примеры `COVAR_POP`

`COVAR_SAMP()`

Примеры `COVAR_SAMP`

`STDDEV_POP()`

Примеры `STDDEV_POP`

`STDDEV_SAMP()`

Примеры `STDDEV_SAMP`

`VAR_POP()`

Примеры `VAR_POP`

`VAR_SAMP()`

Примеры `VAR_SAMP`

`REGR_AVGX()`

`REGR_AVGY()`

`REGR_COUNT()`

`REGR_INTERCEPT()`

Примеры `REGR_INTERCEPT`

`REGR_R2()`

`REGR_SLOPE()`

`REGR_SXX()`

`REGR_SXY()`

`REGR_SYY()`