統計學分析報告中怎麼說明兩組資料間沒有關係以及相關性(資料樣本數量少)。怎麼用文字表達出來

2021-04-13 05:13:04 字數 5727 閱讀 2739

1樓:違法de世界

針對兩組資料的相關性可以使用迴歸分析或者相關分析進行。使用spss軟體分別看擬合結果的r值或者相關係數。

我想用檢驗兩組資料的相關性,應該怎麼做?相關與「顯著性差異」的關係?p怎麼求?

2樓:寧子蕁

顯著性0.229,高於0.05,所以這樣分析相關性不成立,而且樣本量太低了,最少30個樣本。

根據表現形式,可分為:模擬資料,由連續函式組成,是指在一定間隔內連續變化的物理量,也可分為圖形資料(如點、線、面)、符號資料、文字資料、影象資料等,如聲音大小和溫度變化等。

3樓:匿名使用者

首先你要明確你要判斷兩組資料相關還是相等, 相等的話檢驗均值看是否顯著性差異.如果要判斷相關的話,可以求相關係數.你已經求出來了是0.

4左右,一般來說,0.4的相關係數說明兩個量是適度的線性相關.

你應該先從相關專業的知識或經驗來判斷樣品中cu和zn含量是否相關,相關的話是什麼相關關係,比如線性,二次還是指數.有了這個理論模型後,再來做迴歸分析.

我給你算了下,兩者直接還是比較好的線性相關的,大概是zn=0.54*cu+117.13

p值表示的是在接受/拒絕假設的臨界點上的置信水平.

4樓:

你發的資料我用spss簡單分析了一下,顯著性0.229,高於0.05,所以這樣分析相關性不成立,而且樣本量太低了,最少30個樣本

如何比較兩組資料之間的差異性

5樓:牽著你的手

從四個方面來回答,

1.設計型別是完全隨機設計兩組資料比較,不知道資料是否是連續性變數。

2.比較方法:如果資料是連續性資料,且兩組資料分別服從正態分佈&方差齊(方差齊性檢驗),則可以採用t檢驗,如果不服從以上條件可以採用秩和檢驗。

3.想知道兩組資料是否有明顯差異?不知道這個明顯差異是什麼意思?是問差別有無統計學意義(即差別的概率有多大)還是兩總體均數差值在哪個範圍波動?

如果是前者則可以用第2步可以得到p值,如果是後者,則是用均數差值的置信區間來完成的。當然兩者的結果在spss中均可以得到。

4.對以上結果spss的實現是:

(1)t檢驗,analyse→compare means→independent-samples t test

(2)秩和檢驗,analyse→noparametric test→2 independent samples

相關係數越大,說明兩個變數之間的關係就越強嗎

6樓:月似當時

樣本的簡單相關係數一般用r表示,計算公式為:

r 的絕對值越大表明相關性越強,要注意的是這裡並不存在因果關係。若r=0,表明兩個變數間不是線性相關,但有可能是其他方式的相關(比如曲線方式)。

利用樣本相關係數推斷總體中兩個變數是否相關,可以用t 統計量對總體相關係數為0的原假設進行檢驗。若t 檢驗顯著,則拒絕原假設,即兩個變數是線性相關的;若t 檢驗不顯著,則不能拒絕原假設,即兩個變數不是線性相關。

擴充套件資料

一些實際工作者用非居中的相關係數(與pearson係數不相相容)。

例如:假設五個國家的國民生產總值分別是1、2、3、5、8(單位10億美元),又假設這五個國家的貧困比例分別是11%、12%、13%、15%、18%。

則有兩個有序的包含5個元素的向量x、y:x = (1, 2, 3, 5, 8) 、 y = (0.11, 0.

12, 0.13, 0.15, 0.

18) 使用一般的方法來計算向量間夾角(參考數量積)。

上面的資料實際上是選擇了一個完美的線性關係:y

= 0.10 + 0.01 x。因此皮爾遜相關係數應該就是1。

把資料居中(x中資料減去 e(x) = 3.8 ,y中資料減去e(y) =

0.138)後得到:x = (−2.

8, −1.8, −0.8, 1.

2, 4.2)、 y = (−0.028, −0.

018, −0.008,

0.012, 0.042)。

7樓:禾鳥

相關係數越大,說明兩個變數之間的關係就越強。當相關係數為1時,兩個變數其實就是一次函式關係。

相關係數介於0與1之間,用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。

相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。由於研究物件的不同,相關係數有多種定義方式,較為常用的是皮爾遜相關係數。

擴充套件資料

(1)相關係數的應用

1、概率論

例:若將一枚硬幣拋n次,x表示n次試驗中出現正面的次數,y表示n次試驗中出現反面的次數。計算ρxy。

解:由於x+y=n,則y=-x+n,根據相關係數的性質推論,得ρxy = − 1。

2、企業物流

例:一種新產品上市,在上市之前,公司的物流部需把新產品合理分配到全國的10個倉庫,新品上市一個月後,要評估實際分配方案與之前考慮的其他分配方案中,是實際分配方案好還是其中尚未使用的分配方案更好。

通過這樣的評估,可以在下一次的新產品上市使用更準確的產品分配方案,以避免由於分配而產生的積壓和斷貨。表1是根據實際資料所列的數表。

通過計算,很容易得出這3個分配方案中,b的相關係數是最大的,這樣就評估到b的分配方案比實際分配方案a更好,在下一次的新產品上市分配計劃中,就可以考慮用b這種分配方法來計算實際分配方案。

3、聚類分析

例:如果有若干個樣品,每個樣品有n個特徵,則相關係數可以表示兩個樣品間的相似程度。藉此,可以對樣品的親疏遠近進行距離聚類。

例如9個小麥品種(分別用a1,a2,...,a9表示)的6個性狀資料見表2,作相關係數計算並檢驗。

由相關係數計算公式可計算出6個性狀間的相關係數,分析及檢驗結果見表3。由表3可以看出,冬季分櫱與每穗粒數之間呈現負相關(ρ = − 0.8982),即麥冬季分櫱越多,那麼每穗的小麥粒數越少,其他性狀之間的關係不顯著。

(2)相關係數的缺點:

需要指出的是,相關係數有一個明顯的缺點,即它接近於1的程度與資料組數n相關,這容易給人一種假象。

因為,當n較小時,相關係數的波動較大,對有些樣本相關係數的絕對值易接近於1;當n較大時,相關係數的絕對值容易偏小。特別是當n=2時,相關係數的絕對值總為1。因此在樣本容量n較小時,我們僅憑相關係數較大就判定變數x與y之間有密切的線性關係是不妥當的。

8樓:西域牛仔王

相關係數介於 -1 與 1 之間,是衡量兩個變數之間線性關係程度的量,

相關係數越大,說明兩個變數之間的線性關係越強。

當相關係數為 1 時,兩個變數其實就是一次函式關係。

9樓:匿名使用者

相關性的強度確實是用相關係數的大小來衡量的,但相關大小的評價要以相關係數顯著性的評價為前提,我們首先應該檢驗相關係數的顯著性,如果顯著,證明相關係數有統計學意義,下一步再來看相關係數大小,如果相關係數沒有統計學意義,那意味著你研究求得的相關係數也許是抽樣誤差或者測量誤差造成的,再進行一次研究結果可能就大不一樣,此時討論相關性強弱的意義就大大減弱了。

在滿足相關係數顯著的條件下,相關係數越大,相關性就越強,這沒錯

10樓:獨梅印血

強強強強強強強強強強強強強強強強強強強強強強強強強強強強

spss菜鳥,想分析兩組資料的相關性,麻煩大神幫忙看一下分析結果...看不太懂

11樓:匿名使用者

pearson correlation 表示copyr值也就是皮爾遜相關係數

r>0 代表兩變數正相關,

r<0代表兩變數負相關。

|r|大於等於0.8時,可以認為兩變數間高度相關;

|r|大於等於0.5小於0.8時,可以認為兩變數中度相關;

|r|大於等於0.3小於0.5時,可以認為兩變數低度相關。

小於0.3說明相關程度弱,基本不相關。

12樓:匿名使用者

你提供的是不完整抄的迴歸分析結果。

模型彙總中的r方說明你的迴歸公式的擬合度很好,也就是說用這個公式模型來進行**的能力很強。r方在0-1之間,越大說明擬合度越好。

r說明兩個變數之間為很密切的正相關關係,r在-1到1之間,r的絕對值越大說明兩個變數之間的相關性越強。

anova**說明你的迴歸模型很顯著,意思是說你的迴歸模型是受統計學支援的。從sig = 0.000就可以看出來。

一般sig如果小於或者等於0.05即可以認為迴歸模型是顯著的,否則就是不顯著的。

但是你的迴歸公式無法從上面的兩個圖推出來。需要更詳細的結果,才能得出迴歸公式。

這兩組資料的相關性,應該用相關性分析,而不是迴歸分析進行。雖然r=0.981可以說明兩組資料之間相關性很強,但上面的兩個表沒有給出它的顯著性。

13樓:匿名使用者

你這是迴歸分析

看下面的方程係數啊

應該是顯著的呢

14樓:匿名使用者

可以做的,迴歸分析主要就是看回歸係數和方程顯著性

我經常幫別人做這類的資料分析的

相關係數多少算具有相關性?

15樓:我是一個麻瓜啊

相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。由於研究物件的不同,相關係數有多種定義方式,較為常用的是皮爾遜相關係數。

相關係數r的絕對值一般在0.8以上,認為a和b有強的相關性。0.3到0.8之間,可以認為有弱的相關性。0.3以下,認為沒有相關性。

擴充套件資料

相關表和相關圖可反映兩個變數之間的相互關係及其相關方向,但無法確切地表明兩個變數之間相關的程度。相關係數是用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。

需要說明的是,皮爾遜相關係數並不是唯一的相關係數,但是最常見的相關係數,以下解釋都是針對皮爾遜相關係數。

依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變數間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變數間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為復相關係數、復判定係數等。

16樓:米飯紅燒排骨

在說明變數之間線性相關程度時,根據經驗,按照相關係數的大小將相關程度分為以下幾種情況:|rl≥0.8時,可視為兩個變數之間高度相關;0.

5≤|rl<0.8時,可視為中度相關;0.3≤|rl<0.

5時,視為低度相關; |rl<0.3時,說明兩個變數之間的相關程度極弱,可視為不相關。

在實際問題中,相關係數一般都是用樣本資料計算得到的,因而帶有一定的隨機性,尤其 是樣本容量比較小時,這種隨機性更大,此時,用樣本相關係數估計總體相關係數可信度會受到很大質疑,也就是說,樣本相關係數並不能說明樣本來自的兩個總體是否具有顯著線性關係。因此,需要對其進行統計推斷,通過檢驗的方法確定變數之間是否存在相關性,即要對總體相關係數ρ=0進行顯著性檢驗。

在x. y都服從正態分佈,及原假設(ρ= 0)為真時,統計量服從自由度為n-2的t分佈。當|t|>+(或p——  汪冬華《多元統計分析與spss應用》

統計學中資料分析題,求大神解答,統計學中資料分析題,求大神解答

help me c c siri what help me。統計學中資料分析的依據和方法有哪些 統計學 通過利用概率論建立數學模型,收集所觀察系統的資料,進行量化的分析 總結,並進而進行推斷和 為相關決策提供依據和參考統計學基本理論研究有 概率極限理論及其在統計中應用 樹形概率 banach空間概率...

統計學中t值p值是什麼意思?怎麼計算?

統計學中,t值是樣本數量小的精度值,需要查表給出。p是精度值,由計算得來。樣本數越多,p值越大,但不會超過1,在0至之間。統計學中的p值代表什麼?我儘量用形象的語言說 p值越小 說明犯第一類錯誤的概率越小 你越可以推翻傳統的 保守的觀點 越可以接受新提出的 感興趣的觀點。什麼是第一類錯誤 統計上把保...

日語當然了。怎麼說日語中當然怎麼說

麼基隆dei 日語其他一些常用語的發音 1 日文 諧音 空你七哇,中文意思 你好。2 日文 諧音 空搬哇,中文意思 晚上好。3 日文 久 諧音 哦黑薩西不離德死,中文意思 好久不見。4 日文 諧音 啊離嘎多郭雜一嘛死,中文意思 謝謝。5 日文 諧音 多一他西嗎西特,中文意思 不用謝。6 日文 諧音 ...