線性迴歸方程判斷依據?使用者6891538497842021-04-23 17:06:20

線性迴歸方程是利用數理統計中的迴歸分析,來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法之一。 線性迴歸也是迴歸分析中第一種經過嚴格研究並在實際應用中廣泛使用的型別。按自變數個數可分為一元線性迴歸分析方程和多元線性迴歸分析方程。

中文名

線性迴歸方程

外文名

Linear regression equation

領域

統計分析

學科

數學

應用

迴歸分析

簡介

在統計學中,線性迴歸方程是利用最小二乘函式對一個或多個自變數和因變數之間關係進行建模的一種迴歸分析。這種函式是一個或多個稱為迴歸係數的模型引數的線性組合。只有一個自變數的情況稱為簡單迴歸,大於一個自變數情況的叫做多元迴歸。(這反過來又應當由多個相關的因變數預測的多元線性迴歸區別,而不是一個單一的標量變數。)

線上性迴歸中,資料使用線性預測函式來建模,並且未知的模型引數也是透過資料來估計。這些模型被叫做線性模型。最常用的線性迴歸建模是給定X值的y的條件均值是X的仿射函式。不太一般的情況,線性迴歸模型可以是一箇中位數或一些其他的給定X的條件下y的條件分佈的分位數作為X的線性函式表示。像所有形式的迴歸分析一樣,線性迴歸也把焦點放在給定X值的y的條件機率分佈,而不是X和y的聯合機率分佈(多元分析領域)。

模型

理論模型

給一個隨機樣本,一個線性迴歸模型假設迴歸子和迴歸量之間的關係是除了X的影響以外,還有其他的變數存在。我們加入一個誤差項(也是一個隨機變數)來捕獲除了之外任何對的影響。所以一個多變數線性迴歸模型表示為以下的形式:

其他的模型可能被認定成非線性模型。一個線性迴歸模型不需要是自變數的線性函式。線性在這裡表示的條件均值在引數裡是線性的。例如:模型在和裡是線性的,但在裡是非線性的,它是的非線性函式[1]。

資料和估計

區分隨機變數和這些變數的觀測值是很重要的。通常來說,觀測值或資料(以小寫字母表記)包括了n個值。

我們有個引數需要決定,為了估計這些引數,使用矩陣表記是很有用的。

其中Y是一個包括了觀測值的列向量,包括了未觀測的隨機成分以及迴歸量的觀測值矩陣:

X通常包括一個常數項。

如果X列之間存線上性相關,那麼引數向量就不能以最小二乘法估計除非被限制,比如要求它的一些元素之和為0。

古典假設

1)樣本是在母體之中隨機抽取出來的。

2)因變數Y在實直線上是連續的,

3)殘差項是獨立同分布的,也就是說,殘差是獨立隨機的,且服從高斯分佈。

這些假設意味著殘差項不依賴自變數的值,所以和自變數X(預測變數)之間是相互獨立的。

在這些假設下,建立一個顯示線性迴歸作為條件預期模型的簡單線性迴歸方程,可以表示為:

求解方法

線性迴歸模型經常用最小二乘逼近來擬合,但他們也可能用別的方法來擬合,比如用最小化“擬合缺陷”在一些其他規範裡(比如最小絕對誤差迴歸),或者在迴歸中最小化最小二乘損失函式的懲罰。相反,最小二乘逼近可以用來擬合那些非線性的模型。因此,儘管最小二乘法和線性模型是緊密相連的,但他們是不能劃等號的[2]。