Matplotlib yra galinga braižymo biblioteka, naudojama Python programavimo kalboje. Tai suteikia į objektą orientuotą API, skirtą brėžiniams įterpti į programas, kurios naudoja bendrosios paskirties GUI įrankių rinkinius, tokius kaip Tkinter, wxPython arba Qt. Viena iš svarbių „Matplotlib“ teikiamų įrankių yra galimybė sukurti pasikliautinojo intervalo diagramą.
Pasitikėjimo intervalas, kaip statistinis terminas, reiškia atrankos metodo tikrumo laipsnį. Pasitikėjimo lygis parodo, kiek galite būti tikras, išreikštas procentais. Pavyzdžiui, 99 % patikimumo lygis rodo, kad kiekvienas iš jūsų tikimybių įvertinimų gali būti tikslus 99 % laiko.
Pasitikėjimo intervalo diagramos kūrimas naudojant Matplotlib
Pasikliautinojo intervalo diagramos kūrimas „Matplotlib“ apima kelis veiksmus. Pasigilinkime į atitinkamo Python kodo paaiškinimą, kad atliktume šiuos veiksmus:
Pirmiausia turime importuoti reikiamas bibliotekas:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
Dabar galime apskaičiuoti pasikliautinąjį intervalą atlikdami šiuos veiksmus.
1. Nustatykite atsitiktinį duomenų rinkinį, kurio pasikliautinąjį intervalą apskaičiuosime.
2. Apskaičiuokite duomenų rinkinio vidutinę ir standartinę paklaidą.
3. Nustatykite pasikliautinojo intervalo paklaidą.
4. Galiausiai apskaičiuokite pasikliautinojo intervalo diapazoną.
Štai Python kodas, atitinkantis šiuos veiksmus.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
Kintamasis „pasitikėjimas“ yra pasikliovimo lygis, išreikštas procentais, o „duomenys“ apima atsitiktinį duomenų rinkinį. Vidutinė ir standartinė paklaida apskaičiuojamos atitinkamai naudojant SciPy bibliotekos „mean“ ir „sem“ funkcijas. Klaidos riba „h“ nustatoma standartinę paklaidą padauginus iš t balo, kurį gauname iš t skirstinio naudodami funkciją „ppf“. Galiausiai apskaičiuojame pasikliautinojo intervalo diapazoną.
Pasitikėjimo intervalo braižymas Matplotlib
Šioje paskutinėje kodo dalyje mes naudojame Matplotlib, kad vizualizuotume pasitikėjimo intervalą.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
Jis naudoja juostos diagramą duomenims rodyti ir metodą „fill_between“, kad parodytų pasikliautinąjį intervalą. Funkcija „figūra“ inicijuoja naują figūrą, o funkcija „rodyti“ pateikia brėžinį.
Pasitikėjimo intervalo diagramos kūrimas Matplotlib yra patogus būdas vizualiai analizuoti duomenis, ypač duomenis, kurie apima statistinę analizę. Šis galingas įrankis siūlo lengvas ir intuityvus būdas pateikti sudėtingus duomenis tokia forma, kurią būtų galima lengvai interpretuoti, todėl tai yra esminis įrankių rinkinys bet kuriam python duomenų analitikui ar mokslininkui. Suprasdami, kaip tuo manipuliuoti ir naudoti, duomenų interpretavimo procesą galime padaryti efektyvesnį ir tikslesnį.