ฉันชอบสิ่งอำนวยความสะดวกการวางแผนที่มาพร้อมกับแพนด้า ใช่ มีห้องสมุดวางแผนอื่น ๆ มากมาย เช่น Seaborn, Bokeh และ Plotly แต่สำหรับวัตถุประสงค์ส่วนใหญ่ ฉันมีความสุขมากกับความเรียบง่ายของการวางแผน Pandas
โครงการจาวาสคริปต์สำหรับนักเรียน
แต่มีสิ่งหนึ่งที่ฉันต้องการ และนั่นคือความสามารถในการพลอตเส้นถดถอยบนเส้นที่ซับซ้อนหรือพล็อตแบบกระจาย
แต่อย่างที่ฉันได้ค้นพบ สิ่งนี้แก้ไขได้ง่ายมาก ด้วยไลบรารี Numpy คุณสามารถสร้างข้อมูลการถดถอยในโค้ดสองสามบรรทัด และลงจุดในรูปแบบเดียวกับบรรทัดเดิมหรือพล็อตแบบกระจาย
นั่นคือสิ่งที่เราจะทำในบทความนี้
อันดับแรก มาหาข้อมูลกันก่อน หากคุณเคยอ่านบทความก่อนหน้าของฉันเกี่ยวกับการแสดงข้อมูลเป็นภาพ คุณจะรู้ว่าจะมีอะไรต่อไป ฉันจะใช้ชุดข้อมูลสภาพอากาศที่คุณสามารถดาวน์โหลดได้จากบัญชี Github ของฉัน บันทึกอุณหภูมิ ระดับแสงแดด และปริมาณน้ำฝนในช่วงหลายทศวรรษของลอนดอนในสหราชอาณาจักร และจัดเก็บเป็นไฟล์ CSV ไฟล์นี้สร้างขึ้นจากข้อมูลสาธารณสมบัติที่บันทึกโดย UK Met Office
ฤดูร้อนที่ลอนดอนร้อนขึ้นไหม
เราจะตรวจสอบว่าอุณหภูมิในลอนดอนสูงขึ้นเมื่อเวลาผ่านไปหรือไม่ ข้อมูลดิบไม่ชัดเจนแต่โดยพล็อตเส้นการถดถอยเหนือข้อมูลนั้น เราจะสามารถเห็นแนวโน้มได้ดีขึ้น
ในการเริ่มต้นเราต้องนำเข้าไลบรารีที่เราต้องการ
import pandas as pd import numpy as np import matplotlib.pyplot as plt
ไม่มีอะไรผิดปกติมากนัก เรากำลังนำเข้า Pandas เพื่อช่วยในการวิเคราะห์ข้อมูลและการแสดงภาพ Numpy จะให้ขั้นตอนที่จำเป็นในการสร้างข้อมูลการถดถอย และ Pandas ใช้ Matplotlib เพื่อสร้างพล็อต
ต่อไปเราจะดาวน์โหลดข้อมูล
#pandas #linear-regression #data-visualization #python #data-science #data analysis
ต่อdatascience.com
พล็อตถดถอยกับ Pandas และ Numpy
การเพิ่มเส้นถดถอยลงในแปลง Python ของคุณสามารถเปิดเผยแนวโน้มที่อาจไม่มีใครสังเกตเห็น ฉันชอบสิ่งอำนวยความสะดวกการวางแผนที่มาพร้อมกับแพนด้า