Khóa học Phát triển Python Nâng cao
Chương
>
Cấp độ
Các mô-đun toán học
Mô-đun Thống Kê
Mục tiêu
Đi xuống văn phòng và ghi chép một số dữ liệu thống kê cho các chỉ số của trang trại bằng cách sử dụng module thống kê.
Xuống cầu thang từ gác mái là có một văn phòng, bên trong đó chứa các tập tin lưu trữ dữ liệu quan trọng của trang trại. Sẽ là một ý tưởng hay khi xử lý dữ liệu đó và ghi lại để dự đoán sự tăng trưởng của trang trại trong tương lai. Để làm điều này, chúng ta sẽ triển khai sử dụng Module thống kê. Các module cho phép chúng ta nhập các công cụ như hàm, lớp và những thứ tương tự, mở rộng chức năng của Python. Để thiết lập một module, bạn cần viết import trước tên của module, đúng vậy, bạn đã sử dụng một module để điều khiển người chơi suốt khoảng thời gian qua!
import statistics
Module này thêm vào một số hàm để tính toán thống kê, dưới đây là một số hàm mà chúng ta sẽ sử dụng để xử lý dữ liệu thống kê trong văn phòng:
statistics.mean(): Tính giá trị trung bình của một tập hợp dữ liệustatistics.median(): Tính giá trị trung vị của một tập hợp dữ liệustatistics.median_low(): Tính giá trị trung vị thấp nhất của một tập hợp dữ liệustatistics.median_high(): Tính giá trị trung vị cao nhất của một tập hợp dữ liệustatistics.mode(): Tính xu hướng trung tâm của một tập hợp dữ liệu, nói cách khác là giá trị xuất hiện nhiều nhất trong mẫu dữ liệu.statistics.variance(): Tính phương sai của các giá trị trong một tập hợp dữ liệu. Con số cao cho biết các giá trị phân tán, còn con số thấp cho biết các giá trị gần nhau.
Bắt đầu bằng cách đi đến dấu X sáng bên trước các tủ hồ sơ, sử dụng hàm read() để kiểm tra các tập tin và đọc dữ liệu. Có ba (3) báo cáo cần đọc trong trường, hãy tạo ba (3) danh sách để lưu trữ dữ liệu cho mỗi báo cáo: weather_report, export_report và harvest_report. Dữ liệu trong mỗi báo cáo chứa sáu (6) giá trị đại diện cho dữ liệu liên quan đến sáu (6) tháng đầu tiên của năm. Lưu ý và lưu trữ sáu (6) giá trị trong từng danh sách khi bạn đọc chúng.
Sau khi bạn đã ghi chú và lưu trữ dữ liệu vào các danh sách, hãy đi đến dấu X tối trên tấm thảm màu xanh. Tạo năm biến có tên: mean, median, low, high và variance. Các biến này sẽ chứa giá trị của các hàm thống kê mà chúng ta đã nêu ở trên. Cách thức thực hiện là thêm danh sách của báo cáo mà bạn muốn lấy thống kê, điều này sẽ tạo ra các thống kê cho dữ liệu được cung cấp.
mean = statistics.mean( report list ) median = statistics.median( report list ) low = statistics.median_low( report list ) high = statistics.median_high( report list ) variance = statistics.variance( report list )
Với dữ liệu thống kê này, chúng ta sẽ sử dụng hàm write() để ghi chú dữ liệu vào các bản ghi, trình soạn thảo mã sẽ có sẵn các chuỗi được viết trước. Trên dấu X trên tấm thảm màu xanh, hãy phác thảo các biến cho export_report và ghi chúng lại. Trên dấu X trên tấm thảm màu xanh lá, hãy phác thảo các biến cho harvest_report và ghi chúng lại. Trên dấu X trên tấm thảm màu đỏ, hãy phác thảo các biến cho weather_report và ghi chúng lại. Bạn phải điền đầy đủ các biến cho từng báo cáo trước khi ghi chúng ra để có dữ liệu thống kê chính xác cho mỗi báo cáo.
Sau khi tất cả dữ liệu thống kê đã được ghi lại, hãy đi đến dấu X vàng và tạo một danh sách mới có tên group_report. Trong danh sách này, bạn sẽ thêm export_report và harvest_report theo thứ tự đó. Điều này sẽ tạo ra một danh sách lồng nhau mà các hàm thống kê không sử dụng được, để khắc phục điều này hãy sử dụng List comprehension để làm phẳng danh sách lồng nhau, như sau: group_report= [item for sublist in group_report for item in sublist]
Thiết lập thêm hai biến nữa: variance và mode với các hàm thống kê tương ứng của chúng. Thêm danh sách group_report vào hàm tính phương sai, và thêm danh sách weather_report vào hàm tính mode, như sau: variance = statistics.variance( group_report ), mode = statistics.mode( weather_report ). Thực thi hàm write() được thiết lập trong trình soạn thảo mã cho các biến này để hoàn thành cấp độ.