Exemples VAR_SAMP
VAR_SAMP
SELECT
dept_no,
VAR_SAMP(salary)
FROM employee
GROUP BY dept_no
VAR_SAMP
VAR_SAMP
SELECT
dept_no,
VAR_SAMP(salary)
FROM employee
GROUP BY dept_no
Les fonctions de régression linéaire sont utiles pour poursuivre une ligne de tendance. Une ligne de tendance est généralement un modèle qui est suivi par un ensemble de valeurs. Une ligne de tendance est utile pour prédire les valeurs futures, ce qui signifie que la tendance se poursuivra dans le futur. Pour poursuivre une ligne de tendance, la pente et le point d’intersection avec l’axe Y doivent être connus. L’ensemble des fonctions linéaires comprend des fonctions permettant de calculer ces valeurs.
Dans la syntaxe de la fonction, u est interprété comme une variable dépendant de x.
REGR_AVGX()
DSQL
REGR_AVGX ( <y>, <x> )
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
DOUBLE PRECISION
La fonction REGR_AVGX
calcule la moyenne de la ligne de régression de la variable indépendante.
La fonction REGR_AVGX(<y>, <x>)
est équivalente à
SUM(<exprX>) / REGR_COUNT(<y>, <x>) <exprX> ::= CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END
[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-regr-avgy].
REGR_AVGY()
DSQL
REGR_AVGY(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
DOUBLE PRECISION
La fonction REGR_AVGY
calcule la moyenne de la variable dépendante de la ligne de régression.
La fonction REGR_AVGY(<y>, <x>)
est équivalente à
SUM(<exprY>) / REGR_COUNT(<y>, <x>) <exprY> ::= CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <y> END
[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-regr-avgx].
REGR_COUNT()
DSQL
REGR_COUNT(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
BIGINT
La fonction REGR_COUNT
renvoie le nombre de paires non vides utilisées pour créer la ligne de régression.
La fonction REGR_COUNT(<y>, <x>)
est équivalente à
SUM(CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN 1 END)
Voir aussi :[fblangref-aggfuncs-sum]
REGR_INTERCEPT()
DSQL
REGR_INTERCEPT(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable indépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées en tant qu’expression ne sont pas autorisées. |
DOUBLE PRECISION
La fonction REGR_INTERCEPT
calcule le point d’intersection de la ligne de régression avec l’axe des ordonnées.
La fonction REGR_INTERCEPT(<y>, <x>)
est équivalente à
REGR_AVGY(<y>, <x>) - REGR_SLOPE(<y>, <x>) * REGR_AVGX(<y>, <x>)
REGR_INTERCEPT
WITH RECURSIVE years(byyear) AS (
SELECT 1991 FROM rdb$database UNION ALL
SELECT byyear+1 FROM years WHERE byyear < 2020
),
s AS (
SELECT EXTRACT(YEAR FROM order_date) AS byyear,
SUM(total_value) AS total_value
FROM sales GROUP BY 1
),
regr AS (
SELECT REGR_INTERCEPT(total_value, byyear) as intercept,
REGR_SLOPE(total_value, byyear) as slope
FROM s)
SELECT years.byyear AS byyear,
intercept + (slope * years.byyear) AS total_value
FROM years CROSS JOIN regr
BYYEAR TOTAL_VALUE ---------------------------- 1991 118377,35 1992 414557,62 1993 710737,89 1994 1006918,16 1995 1303098,43 1996 1599278,69 1997 1895458,96 1998 2191639,23 1999 2487819,50 2000 2783999,77 ...
REGR_R2()
DSQL
REGR_R2(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
DOUBLE PRECISION
La fonction REGR_R2
calcule le coefficient de détermination, ou R-carré, de la ligne de régression.
La fonction REGR_R2(<y>, <x>)
est équivalente à
POWER(CORR(<y>, <x>), 2)
REGR_SLOPE()
DSQL
REGR_SLOPE(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
DOUBLE PRECISION
La fonction REGR_SLOPE
calcule la pente de la ligne de régression.
La fonction REGR_SLOPE(<y>, <x>)
est équivalente à
COVAR_POP(<y>, <x>) / VAR_POP(<exprX>) <exprX> :== CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END
[fblangref-aggfuncs-covar-pop], [fblangref-aggfuncs-var-pop].
REGR_SXX()
DSQL
REGR_SXX(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
DOUBLE PRECISION
Statistique de diagnostic utilisée pour l’analyse de régression.
La fonction REGR_SXX(<y>, <x>)
est calculée comme suit :
REGR_COUNT(<y>, <x>) * VAR_POP(<exprX>) <exprX> :== CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END
[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-var-pop].
REGR_SXY()
DSQL
REGR_SXY(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
DOUBLE PRECISION
Statistique de diagnostic utilisée pour l’analyse de régression.
La fonction REGR_SXY(<y>, <x>)
est calculée comme suit :
REGR_COUNT(<y>, <x>) * COVAR_POP(<y>, <x>)
[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-covar-pop].
REGR_SYY()
DSQL
REGR_SYY(<y>, <x>)
Paramètre | Description |
---|---|
y |
Variable dépendante de la ligne de régression. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
x |
Une variable de ligne de régression indépendante. Peut contenir une colonne de table, une constante, une variable, une expression, une fonction non agrégée ou une UDR qui renvoie un type de données numériques. Les fonctions agrégées ne sont pas autorisées comme expression. |
DOUBLE PRECISION
La statistique de diagnostic utilisée pour l’analyse de régression.
La fonction REGR_SYY(<y>, <x>)
est calculée comme suit :
REGR_COUNT(<y>, <x>) * VAR_POP(<exprY>) <exprY> :== CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <y> END
[fblangref-aggfuncs-regr-count], [fblangref-aggfuncs-var-pop].