色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉

<cite id="8i6gm"><form id="8i6gm"><tbody id="8i6gm"></tbody></form></cite>

<s id="8i6gm"></s>

"); //-->

博客專欄

EEPW首頁 > 博客 > 統(tǒng)計(jì)學(xué)常犯錯(cuò)誤TOP榜，避坑防雷指南！

統(tǒng)計(jì)學(xué)常犯錯(cuò)誤TOP榜，避坑防雷指南！

發(fā)布人：數(shù)據(jù)派THU 時(shí)間：2022-06-19 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

發(fā)布文章

源：知乎良好研究方法作者：求知鳥 pythonic生物人

1. 變量之間關(guān)系可以分為兩類：

函數(shù)關(guān)系：反映了事務(wù)之間某種確定性關(guān)系相關(guān)關(guān)系：兩個(gè)變量之間存在某種依存關(guān)系，但二者并不是一一對(duì)應(yīng)的；反映了事務(wù)間不完全確定關(guān)系；
2. 為什么要對(duì)相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)？

實(shí)際上完全沒有關(guān)系的變量，在利用樣本數(shù)據(jù)進(jìn)行計(jì)算時(shí)也可能得到一個(gè)較大的相關(guān)系數(shù)值（尤其是時(shí)間序列數(shù)值）
當(dāng)樣本數(shù)較少，相關(guān)系數(shù)就很大。當(dāng)樣本量從100減少到40后，相關(guān)系數(shù)大概率會(huì)上升，但上升到多少，這個(gè)就不能保證了；取決于你的剔除數(shù)據(jù)原則，還有這組數(shù)據(jù)真的可能不存在相關(guān)性；

改變兩列數(shù)據(jù)的順序，不會(huì)對(duì)相關(guān)系數(shù)，和散點(diǎn)圖（擬合的函數(shù)曲線）造成影響；對(duì)兩列數(shù)據(jù)進(jìn)行歸一化處理，標(biāo)準(zhǔn)化處理，不會(huì)影響相關(guān)系數(shù)；我們計(jì)算的相關(guān)系數(shù)是線性相關(guān)系數(shù)，只能反映兩者是否具備線性關(guān)系。相關(guān)系數(shù)高是線性模型擬合程度高的前提；此外相關(guān)系數(shù)反映兩個(gè)變量之間的相關(guān)性，多個(gè)變量之間的相關(guān)性可以通過復(fù)相關(guān)系數(shù)來衡量；
3. 增加變量個(gè)數(shù)，R2會(huì)增大；P值，F(xiàn)值只要滿足條件即可，不必追求其值過?。?/span>
4. 多重共線性與統(tǒng)計(jì)假設(shè)檢驗(yàn)傻傻分不清？
多重共線性與統(tǒng)計(jì)假設(shè)沒有直接關(guān)聯(lián)，但是對(duì)于解釋多元回歸的結(jié)果非常重要。相關(guān)系數(shù)反應(yīng)兩個(gè)變量之間的相關(guān)性；回歸系數(shù)是假設(shè)其他變量不變，自變量變化一個(gè)單位，對(duì)因變量的影響，而存在多重共線性（變量之間相關(guān)系數(shù)很大），就會(huì)導(dǎo)致解釋困難；比如y~x1+x2；x·1與x2存在多重共線性，當(dāng)x1變化一個(gè)單位，x2不變，對(duì)y的影響；而x1與x2高度相關(guān)，就會(huì)解釋沒有意義。
一元回歸不存在多重共線性的問題；而多元線性回歸要摒棄多重共線性的影響；所以要先對(duì)所有的變量進(jìn)行相關(guān)系數(shù)分析，初步判定是否滿足前提---多重共線性。
5. 時(shí)間序列數(shù)據(jù)會(huì)自發(fā)呈現(xiàn)完全共線性問題，所以我們用自回歸分析方法；
6. 什么樣的模型才是一個(gè)好模型？
在測試集表現(xiàn)與預(yù)測集相當(dāng)，說明模型沒有過度擬合：在訓(xùn)練集上表現(xiàn)完美，在測試集上一塌糊涂；原因：模型過于剛性：“極盡歷史規(guī)律，考慮隨機(jī)誤差”；擬合精度不能作為衡量模型方法的標(biāo)準(zhǔn)；
一個(gè)好的模型：只描述規(guī)律性的東西（抓住事務(wù)的主要特征），存在隨機(jī)誤差是好事，在預(yù)測時(shí)，就有了“容錯(cuò)空間”，預(yù)測誤差可能減??！
7. 假設(shè)檢驗(yàn)顯著性水平的兩種理解：

顯著性水平：通過小概率準(zhǔn)則來理解，在假設(shè)檢驗(yàn)時(shí)先確定一個(gè)小概率標(biāo)準(zhǔn)----顯著性水平；用表示；凡出現(xiàn)概率小于顯著性水平的事件稱小概率事件；
通過兩類錯(cuò)誤理解：為拒絕域面積

8. 中心極限定律與大數(shù)定理：

大數(shù)定理---正態(tài)分布的“左磅”，隨著樣本數(shù)的增加，樣本的平均值可以估計(jì)總體平均值；
中心極限定理---正態(tài)分布的“右臂”具有穩(wěn)定性，大數(shù)定理說明大量重復(fù)實(shí)驗(yàn)的平均結(jié)果具有穩(wěn)定解決了變量均值的收斂性問題中心極限定理說明隨機(jī)變量之和逐漸服從某一分布，解決了分布收斂性問題。
9. 方差
方差能最大程度的反映原始數(shù)據(jù)信息；

反映了一組數(shù)據(jù)相對(duì)于平均數(shù)的波動(dòng)程度，相比于，其平方項(xiàng)更放大了波動(dòng)，且差的平方在數(shù)學(xué)公式推導(dǎo)上有大用。
10. 使用最小二乘法條件：

自變量之間不能存在完全共線性；
總體方程誤差項(xiàng)服從均值為0的正態(tài)分布（大數(shù)定理）
誤差項(xiàng)的方差不受自變量影響且為固定值；（同方差性）

11. 最大似然估計(jì)與最小二乘法區(qū)別

最小二乘法是基于幾何意義上距離最小
最大似然估計(jì)是基于概率意義上出現(xiàn)的概率最大
最小二乘法：對(duì)數(shù)據(jù)分布無要求
最大似然估計(jì)：需要知道概率密度函數(shù)

12. 關(guān)于H0與H1
H0：原假設(shè)，零假設(shè)----零是相關(guān)系數(shù)為0，說明兩個(gè)變量無關(guān)系H1:備用假設(shè)
如何設(shè)置原假設(shè)：
1）H0與H1是完備事件組，相互對(duì)立，有且只有一個(gè)成立
2）在確立假設(shè)時(shí)，先確定備設(shè)H1，然后再確定H0，且保證“=”總在H0上
3）原H0一般是需要反駁的，而H1是需要支持的
4）假設(shè)檢驗(yàn)只提供原假設(shè)不利證據(jù)
即使“假設(shè)”設(shè)置嚴(yán)密，檢驗(yàn)方法“精確”；假設(shè)檢驗(yàn)始終是建立在一定概率基礎(chǔ)上的，所以我們常會(huì)犯兩類錯(cuò)誤；
第一類：原H0是真，卻拒絕原假設(shè)；犯類錯(cuò)誤第二類：原H0是假，卻不拒絕原假設(shè)；犯類錯(cuò)誤通常只能犯兩種錯(cuò)誤中的一種，且增加，減少通常，類錯(cuò)誤是可控的，先設(shè)法降低第一類錯(cuò)誤概率
13. 什么是雙尾檢驗(yàn)，單尾檢驗(yàn)？
1）當(dāng)H0采用等號(hào)，而H1采用不等號(hào)，雙尾檢驗(yàn)2）當(dāng)H0是有方向性的，單尾檢驗(yàn)
14. P值

當(dāng)原假設(shè)為真時(shí)，比所得到的樣本觀察，結(jié)果更極端的結(jié)果會(huì)出現(xiàn)的概率。
如果P值很小，我們拒絕原假設(shè)的理由越充分。
P的意義不表示兩組差別大小，p反映兩組差別有無統(tǒng)計(jì)學(xué)意義
顯著性檢驗(yàn)只是統(tǒng)計(jì)結(jié)論，判斷差別還需要專業(yè)知識(shí)；

15. T檢驗(yàn)與U檢驗(yàn)

當(dāng)樣本容量n夠大，樣本觀察值符合正態(tài)分布，可采用U檢驗(yàn)
當(dāng)樣本容量n較小，若觀測值符合正態(tài)分布，可采用T型檢驗(yàn)

16. 方差分析
主要用于兩樣本及以上樣本間的比較，又被稱為F檢驗(yàn)，變異數(shù)分析；
基本思想：通過分析研究不同來源的變異對(duì)總體變異的貢獻(xiàn)大小，從而確定可控因素對(duì)研究結(jié)果影響力的大?。?/strong>
總變異可以被分解為組間變異與組內(nèi)變異

組間變異：由于不同實(shí)驗(yàn)處理而造成的各組之間的變異
組內(nèi)變異：組內(nèi)各被適變量的差異范圍所呈現(xiàn)的變異

17. 直方圖：對(duì)數(shù)據(jù)進(jìn)行整體描述，突出細(xì)節(jié)
箱線圖：對(duì)數(shù)據(jù)進(jìn)行概要描述，或?qū)Σ煌瑯颖具M(jìn)行比較。箱線圖可以讓我們迅速了解數(shù)據(jù)的匯集情況（這個(gè)樣本，緊密的集合在一起；哇，這個(gè)樣本不那么密集；這個(gè)樣本，大部分向左偏，哇，這個(gè)樣本大部分向右偏。）
但是請(qǐng)注意：一個(gè)直方圖比1000個(gè)p值更重要，拿到數(shù)據(jù)先繪制散點(diǎn)圖、直方圖、箱線圖看看，再?zèng)Q定用什么描述！
18. 霜線圖
對(duì)于分位數(shù)的理解：霜線圖看數(shù)據(jù)分布特征統(tǒng)計(jì)學(xué)中，把所有數(shù)值由小到大排列并分成四等份，處于三個(gè)分割點(diǎn)位置的得分就是四分位數(shù)。所以，四分位數(shù)有三個(gè)！四指四等份！

第一四分位數(shù)：下四分位數(shù)；等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字（所以下四分位數(shù)可以不是樣本中的數(shù)值，它是一個(gè)統(tǒng)計(jì)指標(biāo)（就像平均數(shù)一樣，不一定是原數(shù)據(jù)中的一點(diǎn)）
第二四分位數(shù)：中位數(shù)
第三四分位數(shù)：上四分位數(shù)

其中，下四分位數(shù)與上四分位數(shù)的距離叫四分位距?。↖QR）

一元回歸不存在多重共線性的問題；而多元線性回歸要摒棄多重共線性的影響；所以要先對(duì)所有的變量進(jìn)行相關(guān)系數(shù)分析，初步判定是否滿足前提---多重共線性。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=119&cb=INSERT_RANDOM_NUMBER_HERE&n=ae6854a5' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識(shí)別電阻識(shí)別電容識(shí)別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統(tǒng)

智能計(jì)算 Meta AI | 2024-07-31

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

Nvidia的CEO談AI的未來：“我們將需要三臺(tái)電腦... 一臺(tái)來創(chuàng)建AI... 一臺(tái)來模擬AI... 一臺(tái)來運(yùn)行AI”

智能計(jì)算 AI | 2024-07-31

萬家樂JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬家樂 | 2013-01-17

WTC-AI太陽能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

WTC-AI型太陽能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

國際奧委會(huì)：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會(huì) 體育 | 2024-07-26

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

如何快速搭建手寫體識(shí)別演示系統(tǒng)

視頻 digikey AI 手寫體識(shí)別 | 2022-07-29

AI+機(jī)器視覺成趨勢，圖文詳解N大應(yīng)用場景

智能計(jì)算安森美 AI 機(jī)器視覺 | 2024-07-31

CSR8670CSR8675智能語音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計(jì)算 AI 智能計(jì)算深圳 | 2024-07-30

海聯(lián)達(dá)（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

AI驅(qū)動(dòng)的嵌入式聲音和振動(dòng)識(shí)別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

iPhone 16將不會(huì)預(yù)裝AI功能？計(jì)劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

上一篇：人體「發(fā)電廠」？穩(wěn)定輸出5個(gè)月，輕松點(diǎn)亮100個(gè)LED燈

下一篇：視覺分類任務(wù)中處理不平衡問題的loss比較

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=86&cb=INSERT_RANDOM_NUMBER_HERE&n=a674caa6' border='0' alt='' /></a>

焦點(diǎn)
更多>>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=112&cb=INSERT_RANDOM_NUMBER_HERE&n=a65cd760' border='0' alt='' /></a> <a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=113&cb=INSERT_RANDOM_NUMBER_HERE&n=a38c0199' border='0' alt='' /></a>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=85&cb=INSERT_RANDOM_NUMBER_HERE&n=a50e4511' border='0' alt='' /></a>

推薦視頻
更多>>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=84&cb=INSERT_RANDOM_NUMBER_HERE&n=aaeb3436' border='0' alt='' /></a>

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=98&cb=INSERT_RANDOM_NUMBER_HERE&n=a059f6fc' border='0' alt='' /></a>

技術(shù)專區(qū)

FPGA

DSP

MCU

示波器

步進(jìn)電機(jī)

Zigbee

LabVIEW

Arduino

RFID

NFC

STM32

Protel

GPS

MSP430

Multisim

濾波器

CAN總線

開關(guān)電源

單片機(jī)

PCB

USB

ARM

CPLD

連接器

MEMS

CMOS

MIPS

EMC

EDA

ROM

陀螺儀

VHDL

比較器

Verilog

穩(wěn)壓電源

RAM

AVR

傳感器

可控硅

IGBT

嵌入式開發(fā)

逆變器

Quartus

RS-232

Cyclone

電位器

電機(jī)控制

藍(lán)牙

PLC

PWM

汽車電子

轉(zhuǎn)換器

電源管理

信號(hào)放大器

關(guān)閉
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=120&cb=INSERT_RANDOM_NUMBER_HERE&n=a3b5323a' border='0' alt='' /></a>

技術(shù)頻道

嵌入式

元件/連接器

電源管理

安防電子

汽車電子

EDA與制造

消費(fèi)電子

工業(yè)電子

模擬IC

醫(yī)療電子

測試測量

通信技術(shù)

光電顯示

智能計(jì)算

網(wǎng)絡(luò)與存儲(chǔ)

物聯(lián)網(wǎng)

技術(shù)子站

PI技術(shù)專區(qū)

ADI視頻專區(qū)

ZYNQ技術(shù)社區(qū)

ADI技術(shù)專區(qū)

維博專區(qū)

貝能技術(shù)社區(qū)

Microchip資源技術(shù)社區(qū)

Fluke技術(shù)社區(qū)

Microchip視頻技術(shù)社區(qū)

賽靈思社區(qū)

IR iMotion 數(shù)字電機(jī)技術(shù)社區(qū)

英特爾Quark開發(fā)者俱樂部

MultiSIM BLUE

Andes專區(qū)

蔡司光學(xué)專欄

全媒體矩陣

EEPW微信公眾號(hào)

EEPW視頻號(hào)

EEPW Bilibili號(hào)

EEPW頭條號(hào)

EEPW抖音號(hào)

EEPW編輯部日常

Copyright ? 電子產(chǎn)品世界關(guān)于我們聯(lián)系我們廣告服務(wù) 人才招聘網(wǎng)站地圖

色婷婷AⅤ一区二区三区|亚洲精品第一国产综合亚AV|久久精品官方网视频|日本28视频香蕉