Je kunt die foutcode tegenkomen die de interpretatie met betrekking tot de standaardfoutschatting aangeeft. Er zijn nu een aantal opties die u kunt nemen om dit soort probleem op te lossen, waar we binnenkort op in zullen gaan.

Repareer onmiddellijk eventuele problemen met uw pc. De beste Windows fix-tool voor jou!

De S-compatibele schattingsfout is in feite een schatting van het aantal fouten dat een persoon maakt wanneer u een geschatte waarde voor Y kiest (over alle kleinste-kwadratenlijnen) in plaats van de werkelijke Y-waarde.

R-Squared komt in aanraking met alle aandacht als het gaat om het bepalen hoe goed die lijn past bij een bepaald patroon. Ik ontdekte echter dat R-kwadraat in het verleden absoluut overschat was. Is de waarheid te vertellen dat er een statistictviya is die bijzonder nuttiger zou kunnen zijn? Wedden!

Vandaag zal ik het hebben over een goede maar helaas genegeerde regressiestatistiek: S, fout of gewone regressie. biedt belangrijke R-informatie die de meerderheid van Square niet zal hebben.

Wat is de standaardfout van een algemene regressie (S)?

Wat is een superieure standaardfout van de schatting?

Bij een nieuw 95%-betrouwbaarheidsniveau zou 95% van verschillende geuren binnen een respectinterval moeten vallen dat verband houdt met de standaardproblemen van de gemiddelde melodie van ±1,96. Op basis van een willekeurige steekproef zou ik zeggen dat het werkelijke aantal mensen waarschijnlijk ook binnen dit bereik zal vallen met een betrouwbaarheid van 95%.

S zal kleiner zijn wanneer het type gegevenspunten waarschijnlijk altijd dichter bij de lijn zal zijn.

In de speciale uitvoer van regressiegegevens voor de statistische software van Minitab vindt u een specifieke S naast R-kwadraat in een deel van de sectie Directe modeloverzicht. Beide 1 / 2 geven een algemene maatstaf voor de manier waarop een model bij de tips als geheel past. s wordt verwijderd als zowel de standaardfout in alleen de regressie als de duidelijke foutschatting. Biedt

s staat voor de totale gemiddelde afstand dat de waargenomen alinea’s afwijken van de regressielijn. Handig is dat het u ten onrechte vertelt hoe het voorgaande regressiemodel de waarde gebruikt die afkomstig is van al het gemiddelde van de flexibele respons. Kleinere waarden zijn omdat een superieur resultaat aangeeft dat de waarnemingen veel dichter bij de paslijn liggen.

De lijn die in het bovenste segment van de grafiek wordt weergegeven, komt uit een artikel waarin ik aan de slag ga met BMI om het percentage overgewicht daadwerkelijk te voorspellen. Misschien 3.53399, wat ons twee vertelt dat de gemiddelde stap van de volledige gegevens van de aangemeten lijn ongeveer 3,5% lichaamsvet was.

Wat is een grote gebruikelijke fout van de schatting?

Een grote normale fout betekent waarschijnlijk dat de populatie vaak nogal vluchtig is, dus de steekproeven zouden iets andere gemiddelden moeten geven. Een fout kleiner dan de heersende fout zou normaal gesproken moeten betekenen dat de populatie niet homogeen is, dus uw steekproefbevestiging ligt waarschijnlijk dicht bij het kwantiteitsgemiddelde.

In tegenstelling tot R-Squared, kun je veilig de standaardfout van de hedendaagse regressie gebruiken voor de nauwkeurigheid van de bijbehorende voorspeller van een persoon. Ongeveer 95% van de waarnemingen moet binnen plus ook minus 2 * standaard regressiefouten van de echte regressielijn liggen, dat is ook een bijzonder bijna onmiddellijke benadering van het 95% schattingsinterval.

Voor het BMI-voorbeeld zou ik zeggen: 95% van de belangrijkste waarnemingen moet binnen plus en min 7% van de aangepaste do vallen, wat dicht bij het vermoedensinterval ligt.

Waarom ik je huidige standaardfout voor regressie (S) leuk vind

Vaak geef ik de voorkeur aan de regressie-opwindingsfout boven R-kwadraat. Ik hou van de realiteit, de intuïtiviteit die gepaard gaat met 100% natuurlijke eenheden met een of ander antwoord. En dat ik nauwkeurige voorspellingen nodig heb, kan ik snel startenGebruik S-Check om de nauwkeurigheid te bestuderen.

En precies het tegenovergestelde, een dimensieloos R-vierkant geeft geen handige tip van hoe dicht de gewenste kosten zijn bij die waargenomen in de belangrijkste set. Ook, zoals ik goed opmerkte, is R-kwadraat vooral relevant wanneer iedereen nauwkeurige voorspellingen nodig heeft. U kunt R-kwadraat echter niet gebruiken om de nauwkeurigheid te schatten, wat volgens experts meestal niet nuttig is. onthullen

Laten we voor dit belangrijke feit het BMI-voorbeeld geven. De sorteerregressie geeft R kwadraat van 76,1% S en is bijna zeker 3,53399% lichaamsvet. We gaan ervan uit dat voorspellingen binnen +/- 5% gekoppeld moeten zijn aan de werkelijke waarde.

interpreteer erkende standaardfoutschatting

Is het R-kwadraat erg goed genoeg om dit niveau inclusief nauwkeurigheid te bereiken? Er is geen manier om het te weten. Echter, s moet mogelijk <= 2,5 zijn om een ​​smalle ideeperiode van 95% genoeg te krijgen. Op het eerste gezicht is het duidelijk dat ons model zelfs aanvullende informatie nauwkeurig moet zijn. Bedankt o C!

interpreteer standaardfoutschatting

Meer informatie over het verkrijgen en gebruiken van idee-intervallen en leerregressie op dit belangrijke gebied.

S neemt af wanneer belangrijke informatiecomponenten zich meestal dichter bij uw huidige lijn bevinden.

Stand De fout van de score is natuurlijk waarschijnlijk een maatstaf voor u ziet, de consistentie van de voorspellingen van uw eigen regressiemodel.

  • y: waargenomen waarde
  • Å· : voorspellingswaarde.
  • n: totaal aantal standaard verwarrende observaties.
  • Proxyscores geeft ons een idee dat lijkt op of een regressiemodel past dat je gewoon bijzonder goed begrijpt. In het bijzonder evaluatie:

  • Hoe lager, hoe veel beter de match.
  • Hoe hoger de waarde, hoe slechter de match.
  • Voor een bepaald regressiemodel dat een kleine, maar succesvolle standaardfout van de schatting heeft, worden belangrijke gegevenspunten zwaar gesneden rond de geschatte regressielijn:

    Omgekeerd, met betrekking tot een regressiemodel met één veel voorkomende fout, zijn de gegevenspunten veel vrijer verdeeld langs de regressielijn van een persoon:

    Een belangrijk voorbeeld laat zien hoe onze eigen standaardfout in verband met de schatting van het regressieassortiment wordt afgehandeld en geïnterpreteerd met Excel.

    Voorbeeld: standaardfout van mijn schatting in Excel

    Gebruik het volgende voor de strategie voor het berekenen van de erogene fout verkregen door en het evalueren van alle regressie van het Excel-model.

    Klik vervolgens op elk tabblad Gegevens bovenaan met het lint. Klik dan gewoon in de optie “Gegevensanalyse” in de groep “Analyseren”.

    Als deze optie zeker wordt weergegeven, moet u eerst de ToolPak Scanner downloaden.

    Aanbevolen: Reimage

    Bent u het beu dat uw computer traag werkt? Zit het vol met virussen en malware? Vrees niet, mijn vriend, want Reimage is hier om de dag te redden! Deze krachtige tool is ontworpen om allerlei Windows-problemen te diagnosticeren en te repareren, terwijl het ook de prestaties verbetert, het geheugen optimaliseert en uw pc als nieuw houdt. Wacht dus niet langer - download Reimage vandaag nog!

  • 1. Download en installeer Reimage
  • 2. Open het programma en klik op "Scannen"
  • 3. Klik op "Repareren" om het reparatieproces te starten

  • In de nieuwe opening die verschijnt, vervangt u de toepassingsinformatie:

    We kunnen oefenen met de algemene regressiecoëfficiënten om een ​​ongeveer regressievergelijking te maken:

    Mijn vrouw en ik zien welke de onderliggende fout van een bepaald pre-regressiemodel 6.006 is. Simpel gezegd, dit betekent dat het gemiddelde van alle piekgegevens 6.006 eenheden is voor de regressielijn.

    Reimage PC Repair and Optimizer Tool is de beste manier om uw computerfouten te herstellen. Het is gemakkelijk, efficiënt en 100% veilig. Probeer het nu!