test chi-kwadrat Pearsona

Young woman

Temat: zamiast testu chi-kwadrat .. jaki inny?
witam, mam problem - własnie opracowuje ankiety do pracy magisterskiej .. i pojawił się problem przy testowaniu hipotez... generalnie opracowałam wszystko testem chi-kwadrat, później gdy wyszło ze zmienne są zależne, testowałam siłę korelacji wsp. T-Czuprowa albo C-Pearsona.
Tylko, że ;
większość moich tablic to tablice 2x2, w których liczebności sa mniejsze niz 5 , mogę stosować test chi-kwadrat z poprawką Yatesa? a jak to wygląda gdy mam tablicę większą niż 2x2.. np. 4 na 2 ... jesli mam maniejsze wartości niż 5 ?? jaki test wtedy stosować, bo rozumiem,że chi-kwadrat odpada?
i jeszcze jedno : do tej pory myslałam, że zależność a korelacja to to samo .. może ktoś mi wytłumaczyć różnicę? bo wyszło mi, że zmienne są zależne, obliczyłam korelację = 0,16, co w tablicy związków korelacyjnych oznacza brak korelacji :| więc.. jak to jest ?
Dzięki z góry wszystkim za odpowiedz :)
Źródło: statystycy.pl/viewtopic.php?t=684



Temat: Interpretacja przedziału ufności
1.Zadaniem testu t-Studenta przy porównywaniu dwóch średnich jest:
a) weryfikacja hipotezy o normalności rozkładu zmiennych
b)weryfikacja hipotezy o skorelowaniu zbiorów
c)weryfikacja hipotezy o braku różnic między średnimi
d) weryfikacja hipotezy o zróżnicowaniu średnich w zbiorach

2.Która charakterystyka posiada interpretacje ekonomiczną:
a)wariancja
b)odchylenie standardowe
c) ocdchylenie standardowe i wariancja
d)miediana i modalna
e)wszystkie wymienione

3.W celu wskazania różnicy między trzema grupami trzeba wykonać test:
a)Chi kwadrat
b)analizę wariancji
c)test zgodności chi kwadrat
d)wszystki powyższe

4. Ocene współzależności dwoch cech mozemy wykonać przy pomocy:
a)testu t-studenta
b)testu f-snedecora
c)współczynnika determinacji
d)współczynnika zmienności

5. Współczynnik korelacji linowej Pearsona jest:
a)kwadratem współczynnika determinacji
b)moze yć pierwiastkiem kwadratowym współczynnika determinacji
c)nie moze być nigdy ujemny
d)żadna z powyższych odpowiedzi

6. Zadaniem korelacji liniowej jest:
a)badanie zgodności rozkładu
b)badanie wpływu jednej zmiennej na inną zmienną
c)badanie poziomu i kierunku współzależnosci cech
d)badanie stopnia wyjaśnienia zmienności

[ Dodano: 2010-02-16, 17:58 ]
Źródło: statystycy.pl/viewtopic.php?t=1435


Temat: Chi2 test
Witam *statystyka to dla mnie czary mary*

przeprowadziłam badanie w 2 krajach i muszę sprawdzić, które pytania ankietowanych są istotnie statystycznie.
Ja to rozbiłam testem T dla prób niezależnych.
Byłam na konsultacjach u jednej profesorki i one sprawiły, że znalazłam się na tym forum.
Ona robiła mi rożne jakieś tam inne obliczenia i też sprawdzała, które pytania są istotnie statystycznie lecz posłużyła się no właśnie nie wiem czym:(:(:(:( ?
W raporcie jest cos takiego:
tabelka jest zatytułowana "Testy Chi-kwadrat" a w tabelce:
Chi-kwadrat Pearsona
Poprawka na ciągłość
Iloraz wiarygodności
dokładny test Fishera
Test związku liniowego
N ważnych obserwacji

Nie wiem teraz jak opisywać wyniki, którym testem się posłużyłam?? np. Do analizy statystycznej wykorzystano test t dla prób niezależnych.?????
Czy do analizy statystycznej wykorzystano Chi-kwadrat czy Chi-kwadrat Pearsona. .... ???????

I drugie pytanie do Was:
Dlaczego posłużyła się testami Chi-kwadrat a nie testem T ?????

Aha dodam, że porównując istotności które zliczyłam testem T a istotności które ujawnia Chi-kwadrat Pearsona są takie same.

Z góry dziękuję za pomoc
A.
Źródło: statystycy.pl/viewtopic.php?t=89


Temat: Chi2 test

tabelka jest zatytułowana "Testy Chi-kwadrat" a w tabelce:
Chi-kwadrat Pearsona
Poprawka na ciągłość
Iloraz wiarygodności
dokładny test Fishera
Test związku liniowego
N ważnych obserwacji

Nie wiem teraz jak opisywać wyniki, którym testem się posłużyłam??

Tutaj posłużono się testem Chi^2. Jego wyniki można opisać można z wartości w kilku wierszach. Pierwszym wynikiem jest istotność, drugim wartość testu – te odczytujemy z wiersza: "chi-kwadrat Pearsona". Dodatkowo, jeśli wartości te obliczono na podstawie tabeli 2x2 a liczebności w komórkach były mniejsze niż 5 (ale co najmniej 1) to przy określaniu istotności bierzemy pod uwagę wartość z wiersza "poprawka na ciągłość".
Tak pokrótce wygląda interpertacja wyniku testu. Aby jednak dokładnie opisać kto się od kogo różni i w jaki sposób należy sięgnąć do tabeli krzyżowej (w raporcie spss, to ta bezpośrednio przed tabelą z wartościami testu). Wówczas możesz obejrzeć jako rozkładały się wyniki które okazały się istotnie różne. Taka interpretacja będzie łatwiejsza jeśli w opcjach tabel krzyżowych zaznaczyłaś aby pokazywał wartości procentowe.


Źródło: statystycy.pl/viewtopic.php?t=89


Temat: praca jako badacz/analityk
Co do kariery to sie zobaczy. Po pierwsze nie zawsze rynek jest rozwojowy, po drugie ja nie chce tego traktować jako moje główne zajęcie na przyszłość. Nie odczuwam pasji testując opakowanie do oleju Chciałbym sobie tym sfinansować parę rzeczy i zająć się czymś dla mnie ciekawszym (a to gdzieś ciągnąć na boku).

Co do Twoich rad Pearson:
-We wrzesniu mam dostac 17 tysiecy na dzialalność z UP. Powinno wystarczyc na Statistica 8 i sprzet (komputer,drukarka,projektor itp). Nie będę miał biura więc to redukuje koszty. Zostaje ewentualne wynajmowanie sali na potrzeby badań grupowych. Z tego co się orientowałem moga mi też zfinansować jakiś kurs (czy to angielski czy coś z oferty statsoftu).
-Z tego co wiem jedynym warunkiem tej dotacji jest opłacanie przeze mnie składek ZUS (około 400zl miesiecznie). O jakich opłatach Ty mówisz?
-Analizy przynajmniej na początku nie powinny być skomplikowane. Głównie chi kwadrat niezależności, regresja logistyczna, testy istotności różnic. Więc powinienem dać sobie radę Ale skoro się zaoferowałeś, to może powiesz mi gdzie w statistice mogę przeprowadzić w ramach analizy tabeli krzyzowej wiekszej niz 2x2 analizę reszt standaryzowanych skorygowanych?

Do rozpoczęcia działalności jeszcze 2 miesiacie, także będzie teraz mnóstwo liczenia, planowania, organizowania, załatwiania, rejestrowania, rozmów. Tutaj być może, będę potrzebował rad osób, które mają własny biznes.

Poza pewnym know how dotyczącym psychologii reklamy nie wiem nawet ile ludzie za takie usługi biorą To znaczy wiem ze Ci którzy robia badania neuro biora 100 000 ale ja nawet eye-trackingu na początku nie będę oferował, więc to nie jest mój punkt odniesienia.

Dzięki i pozdrawiam,
marek
Źródło: statystycy.pl/viewtopic.php?t=1672


Temat: Proszę o pomoc w rozwiązaniu test prawda fałsz!!!!!!!!!!
1.Statystyka matematyczna zajmuje się metodami wnioskowania:
a. na podstawie próby losowej
b. których podstawą są rachunki prawdopodobieństwa

2. Estymator średniej z populacji jest
a. funkcją elementów próby losowej
b. statystyką

3. Krańce przedziału ufności dla wariancji rozkładu zmiennej losowej są
a. zmiennymi losowymi
b. ustalonymi liczbami

4. Średnia z próby prostej wylosowanej z populacji o rozkładzie normalnym jest estymatorem średniej z populacji, który posiada stepujące własności:
a. jest estymatorem nieobciążonym
b. jest estymatorem najefektywniejszym

5. Przy weryfikacji hipotez statystycznych za pomocą testów istotności możemy podejmować następujące decyzje
a. odrzucamy hipotezę zerową
b. przyjmujemy hipotezę zerową

6. Za pomocą testy zgodności chi-kwadrat przy założeniu że spełnione są warunki stosowalności testu możemy weryfikować następujące hipotezy
a. współczynnik korelacji Pearsona dwóch zmiennych losowych jest równy 0
b. badana zmienna ma rozkład normalny

7. Test dla dwóch wskaźników struktury możemy stosować
a. w przypadku dużych prób
b. w odniesieniu do zmiennych zerojedynkowych

8. Metoda reprezentacyjna zajmuj się
a. częściowymi badaniami statystycznymi
b. wnioskowaniem na podstawie prób reprezentatywnych

9. W przypadku warstwowego schematu losowania próby możemy stosować dla warstw:
a. indywidualny schemat losowania
b. schemat losowania zależnego

10. W klasie estymatorów nieobciążonych danego parametru ten estymator jest najefektywniejszy, którego
a. wariancja jest najmniejsza
b. wartość oczekiwana jest największa

11. Rozkład normalny zmiennej losowej jednowymiarowej jest rozkładem
a. ciągłym
b. skokowym
c. o funkcji gęstości symetrycznej względem pewnej prostej
Źródło: statystycy.pl/viewtopic.php?t=762


Temat: Termin egzaminu
teoria na koło z metod jak ktos chce:)

• REGRESJA- dotyczy kształtu zależności pomiędzy cechami
a) Liniowa
b) Nieliniowa, np. parabola

• KORELACJA- dotyczy siły badanej współzależności

• Analiza regresji i korelacji może dotyczyć dwóch lub więcej badanych zmiennych:

a) Współczynnik korelacji PEARSONA r
r= (cov(x,y))/ S(x)*S(y)

b) kowariancja (cov) :
cov(x,y) = (suma (x-Xśr)*(y-Yśr))/ (n-1)

!!!! Kowariancja w Excelu z funkcji jest mniejsza, wiec z funkci jej nie liczymy, bo w Excelu w mianowniku wzoru jest n a nie (n-1)
!!!! rPearsona zawsze osiąga wartości z przedziału (-1,1), gdy mamy r=-1 lub r=1 to oznacza ze mamy korelację, jeśli r-0 to nie ma korelacji.
Gdy r= -1 to znaczy ze jedna cecha(x albo y) maleje a druga rośnie
Gdy r= 1 to cechy rosną
• WSPÓŁCZYNNIK REGRESJI R to jest r Perasona podniesione do kwadratu

• TESTOWANIE (t) ISTOTNOŚCI WSPÓŁCZYNNIKA KOREACJI- określa czy w populacji generalnej zachodzi podobny związek do zaobserwowanego w populacji próby, czy jest on dziełem przypadku czy jakiejś prawidłowości.

• HIPOTEAZ ZEROWA Ho – prawdziwa wartość współczynnika korelacji (ta z populacji generalnej) jest równa zero (r=0), co jest równoważne brakowi korelacji

t= (r*pierw z (n-2) )/( pierw z (1-r kwadrat))

r –próbkowa wartość rPearsona
n- x i y razem (suma pomiarów = n)
Test jednostronny – pokazuje czy nasza wartość t jest „<" lub ">” od danych w tabeli
Test dwustronny- pokazuje w jakim PRZEDZIALE jest t
• df- ilość stopni swobody (ilość pomiarów odjąć 1) = n-1
Jeżeli obliczona wartość t znajduje się w dwustronnym obszarze krytycznym (-nieskoń., t z tabelki) i (t z tabelki, + nieskoń.) to Ho należy ODRZUCIĆ na korzyść hipotezy alternatywnej (czyli z początku zakładamy ze nie ma korelacji (Ho, r=0), a potem patrzymy na ten obszar i zakładamy ze jest korelacja).
• Zgodność rozkładu próby z rozkładem normalnym (empiryczny z teoretycznym) określa chi kwadrat
X2 = suma [(Oj-Ej)do kwaratu]/ Ej
Oj –zdarzenia obserwowane
Ej- zdarzenia oczekiwane
Oj to jest inaczej liczebność klas w szeregu ai
ai = granice szeregu
Pi = prawdopodobieństwo w klasach
Ej- oczekiwana liczebność = Pi * ilość wszystkich pomiarów (n)

• ROZKŁAD NORMALNY
Wpisujemy do formuły :

x- liczba
średnia : 0
odch. Stand. = 1
skumulowany : prawda

• df= k-p-1
k- ilość klas WZIĘTYCH do obliczeń
p- ilość parametrów szacowanych z próby
Źródło: geologia1.fora.pl/a/a,710.html


Temat: PILNE - ZADANIA
1. Na wykresie histogramu wszystkie słupki są podobnej wielkości. Który z podanych poniżej rozkładów prawdopodobieństwa może być przyjęty jako rozkład analizowanych danych:

a) Rozkład równomierny
b) Rozkład normalny
c) Rozkład dwumianowy
d) Rozkład geometryczny

2. Porównano wyniki dwu kolejnych testów ze statystyki w pewnej grupie studenckiej. Z którego testu statystycznego należy skorzystać, gdy chcemy weryfikować hipotezę o jednakowych rozkładach prawdopodobieństwa wyników obu testów, jeżeli nie wiemy do jakiej klasy należą te rozkłady?

a) Testu t - studenta
b) Testu rangowych znaków Wilcoxona
c) Testu Kruskala – Wallisa

3. W wielowymiarowych modelach regresji liniowej do badania zależności pomiędzy dwiema dowolnymi zmiennymi z wyłączeniem wpływu pozostałych zmiennych wykorzystujemy:

a) Współczynnik korelacji liniowej Pearsona
b) Współczynnik korelacji wielokrotnej
c) Współczynnik korelacji cząstkowej
d) Współczynnik gamma Goldmana - Kruskala

4. W wyniku badania zależności dwu cech statystycznych oszacowano współczynnik korelacji liniowej Pearsona jako równy -0,872 które z poniższych stwierdzeń jest prawdziwe?

a) Nie ma zależności pomiędzy tymi cechami
b) Występuje istotna zależność liniowa
c) Obie cechy są odpowiednio skorelowane
d) Test Chi-Kwadrat Pearsona wskazuje na równość wartości oczekiwanych obu cech

5. Test t – studenta służy do porównywania wartości średnich w dwu populacjach. Które z wymagań musi byś spełnione, by test ten dawał poprawne wyniki:

a) Wariancje w obu próbkach powinny być znane
b) Wariancje w obu populacjach powinny być jednakowe
c) Oszacowania wariancji w obu próbkach powinny być identyczne

6. Porównywano testy ze statystyki w czterech grupach studenckich. Z którego testu statystycznego należy skorzystać, gdy chcemy weryfikować hipotezę o jednakowych czynnikach prawdopodobieństwa wyników testu w tych grupach jeżeli nie wiemy do jakiej klasy…

a) Testu t – studenta
b) Testu czteromianowego
c) Testu Manna – Wilcoxona – Whitneya
d) Testu Kruskala - Wallisa

7. NIECZYTELNE

8. NIECZYTELNE

9. Estymator beta systematycznie zaniża ocenę nieznanego parametru p dla dowolnej liczności próbki. Czy taki estymator jest estymatorem:

a) nieobciążonym
b) zgodnym
c) efektywnym
d) obciążonym

10. W wyniku analizy tych samych danych statystycznych pan Abacki wyznaczył przedział ufności dla nieznanego parametru p na poziomie ufności Beta = 0,90 zaś pan Babacki wyznaczył ten przedział na poziomie ufności Beta = 0,95. Które z poniższych stwierdzeń jest prawdziwe?

a) przedział wyznaczony przez pana Abackiego jest węższy
b) przedział wyznaczony przez pana Abackiego jest szerszy
c) oba przedziały są tej samej długości
d) przedział wyznaczony przez pana Abackiego jest węższy z prawdopodobieństwem p
e) przedział wyznaczony przez pana Abackiego jest szerszy z prawdopodobieństwem p
Źródło: statystycy.pl/viewtopic.php?t=1777


Temat: Chi2 test
Witam serdecznie,

Bardzo proszę Was o pomoc.
Próbuję zrobić analizę do pracy magistersiej siostry. Mam wykonać testy statystyczne ale aby zastosować dany test najpierw należy znać rozkład, czy normalny czy nie. Z histogramów wynika, że obie grupy (wieś i miasto) mają rozkład zbliżony do normalnego. Ale żeby dokładnie to sprawdzić potrzebne jest wykonanie testu chi-kwadrat Pearsona (dla prób dużych)

Najpierw może dane:
Liczba poprawnie wymienionych czynników:
miasto
wieś

0 0 3
1 2 4
2 16 15
3 30 23
4 26 38
5 14 20
6 13 7
7 9 0
Wartość przeciętna dla miasta: 3,99 natomiast dla wsi : 3,61.

A teraz w czym problem.
1) Określenie przedziałów (z tego co wyczytałam próby nie mogą być mniejsze od 5 - co wiąże się z połączeniem wartości) Rozumiem, że w przypadku miasta będzie 6 przedziałów (1,2 ....6) (odpowiednio z wartościami 18, 30, 26, 14, 13, 9) w przypadku wsi też 6 (7, 15, 23, 38, 20, 7). Poprawcie mnie jeśli źle zrozumiałam.
2) Odczytywanie z tablic.
- Przy wartości przeciętnej w mieście nie ma problemu bo odczytuję pi dla 4, natomiast w przypadku wsi wartość przeciętna wynosi 3,61 (dla której cyfry mam zrobić odczyt 3,5 czy 4?)
- po utworzeniu 6 przedziałów (no właśnie wszedzie wymagają przedziały a to przedziały w sumie nie są), które wartości pi mam odczytywać - dla miasta - przy wartości przeciętnej 4,0 i k=1 i tak do k=6, a w przypadku wsi wartość przeciętna (tu nie wiem czy 3,5 czy 4) k = 1 czy zacząć odczytywanie od 0?)

Ale zagmatwałam
Mam nadzieję, że zrozumieliście w czym jest mój problem - mam już niezły mętlik w głowie.
Piszę trochę niejasno tak jak niejasny jest dla mnie ten test

Jeżeli mój tok myślenia jest zły nakierujcie mnie trochę, a może powinnam zastosować całkiem inny test na "normalność" rozkładu?

Jak już z tym sobie poradzę to dalej jakoś pójdzie.

Jeszcze raz bardzo proszę o jakieś wskazówki.
Pozdrawiam,
Agata

EDIT:/
Myślałam, że posiadam wiekszą wiedzę z zakresu statystyki (w końcu w tej katedrze pisałam pracę mgr) w mojej pracy robiłam całkiem inne obliczenia (wskaźniki dynamiki, regresja) a tu przy tej pracy kompletnie zgłupiałam.

Dodam, że w zamian za Waszą nieocenioną pomoc mogę zaoferować swoją na Waszym forum. Mam doświadczenie jeśli chodzi o moderowanie na skrypcie php i Bulletin.

Źródło: statystycy.pl/viewtopic.php?t=89


Powered by wordpress | Theme: simpletex | © Young woman