กำหนดประโยคที่ซับซ้อนที่ไม่ใช่สหภาพ ประโยคที่มีความสัมพันธ์กันอย่างมาก การจำแนกประโยคที่ซับซ้อนแบบไม่รวมกันตามความหมาย
ฉันเป็นนักคณิตศาสตร์และโปรแกรมเมอร์ ที่สุด ก้าวกระโดดครั้งใหญ่ในอาชีพการงานของฉัน ฉันประสบความสำเร็จเมื่อเรียนรู้ที่จะพูดว่า: "ฉันไม่เข้าใจอะไรเลย!"ตอนนี้ฉันไม่ละอายที่จะบอกผู้ทรงคุณวุฒิด้านวิทยาศาสตร์ว่าเขากำลังบรรยายให้ฉันฟัง ฉันไม่เข้าใจว่าเขาซึ่งเป็นผู้ทรงคุณวุฒิกำลังบอกอะไรฉัน และมันยากมาก ใช่แล้ว การยอมรับความไม่รู้ของคุณเป็นเรื่องยากและน่าอาย ใครชอบยอมรับว่าเขาไม่รู้พื้นฐานของบางสิ่งบางอย่าง? เนื่องจากอาชีพของฉันฉันต้องเข้าร่วม ปริมาณมากการนำเสนอและการบรรยาย ซึ่งฉันยอมรับว่าในกรณีส่วนใหญ่ฉันต้องการนอนเพราะฉันไม่เข้าใจอะไรเลย แต่ฉันไม่เข้าใจเพราะปัญหาใหญ่ของสถานการณ์ทางวิทยาศาสตร์ในปัจจุบันอยู่ที่คณิตศาสตร์ ถือว่าผู้ฟังทุกคนคุ้นเคยกับคณิตศาสตร์ทุกด้านอย่างแน่นอน (ซึ่งไร้สาระ) การยอมรับว่าคุณไม่รู้ว่าอนุพันธ์คืออะไร (เราจะพูดถึงมันในภายหลัง) เป็นเรื่องน่าละอาย
แต่ฉันเรียนรู้ที่จะบอกว่า ฉันไม่รู้ว่าการคูณคืออะไร ใช่ ฉันไม่รู้ว่าพีชคณิตย่อยสำหรับพีชคณิตโกหกคืออะไร ใช่ ฉันไม่รู้ว่าทำไมถึงจำเป็นในชีวิต สมการกำลังสอง- ยังไงก็ตามถ้าคุณแน่ใจว่าคุณรู้เรามีเรื่องต้องคุยกัน! คณิตศาสตร์เป็นชุดของเทคนิค นักคณิตศาสตร์พยายามสร้างความสับสนและข่มขู่สาธารณชน ที่ใดไม่สับสน ไม่มีชื่อเสียง ไม่มีอำนาจ ใช่ เป็นเรื่องน่ายกย่องที่จะพูดโดยใช้ภาษาที่เป็นนามธรรมมากที่สุดเท่าที่จะเป็นไปได้ ซึ่งถือเป็นเรื่องไร้สาระโดยสิ้นเชิง
คุณรู้หรือไม่ว่าอนุพันธ์คืออะไร? เป็นไปได้มากว่าคุณจะบอกฉันเกี่ยวกับขีดจำกัดของอัตราส่วนส่วนต่าง ในปีแรกของวิชาคณิตศาสตร์และกลศาสตร์ที่มหาวิทยาลัยแห่งรัฐเซนต์ปีเตอร์สเบิร์ก Viktor Petrovich Khavin บอกฉัน มุ่งมั่นอนุพันธ์เป็นค่าสัมประสิทธิ์ของเทอมแรกของอนุกรมเทย์เลอร์ของฟังก์ชัน ณ จุดหนึ่ง (นี่เป็นยิมนาสติกแยกต่างหากเพื่อกำหนดอนุกรมเทย์เลอร์ที่ไม่มีอนุพันธ์) ฉันหัวเราะกับคำจำกัดความนี้มานานจนในที่สุดฉันก็เข้าใจความหมายของมัน อนุพันธ์นั้นไม่มีอะไรมากไปกว่าการวัดง่ายๆ ว่าฟังก์ชันที่เราหาอนุพันธ์มีความคล้ายคลึงกับฟังก์ชัน y=x, y=x^2, y=x^3 แค่ไหน
ตอนนี้ผมได้รับเกียรติบรรยายให้กับนักศึกษาที่ เกรงกลัวคณิตศาสตร์. ถ้ากลัวคณิตเราก็ไปในทางเดียวกัน ทันทีที่คุณพยายามอ่านข้อความและดูเหมือนว่ามันซับซ้อนเกินไป จงรู้ว่ามันเขียนได้ไม่ดี ฉันยืนยันว่าไม่มีคณิตศาสตร์เพียงด้านเดียวที่ไม่สามารถพูดคุยแบบ "บนนิ้ว" ได้โดยไม่สูญเสียความแม่นยำ
งานมอบหมายสำหรับอนาคตอันใกล้นี้: ฉันมอบหมายให้นักเรียนเข้าใจว่าตัวควบคุมกำลังสองเชิงเส้นคืออะไร อย่าอาย ใช้เวลาสามนาทีในชีวิตของคุณแล้วไปตามลิงก์ หากคุณไม่เข้าใจอะไรเลยเราก็อยู่บนเส้นทางเดียวกัน ฉัน (นักคณิตศาสตร์-โปรแกรมเมอร์มืออาชีพ) ไม่เข้าใจอะไรเลยเช่นกัน และฉันรับรองกับคุณว่า คุณจะเข้าใจสิ่งนี้ได้ "ด้วยนิ้วของคุณ" บน ช่วงเวลานี้ฉันไม่รู้ว่ามันคืออะไร แต่ฉันรับรองว่าเราจะเข้าใจมันได้
ดังนั้น การบรรยายครั้งแรกที่ฉันจะบรรยายให้กับนักเรียนของฉัน หลังจากที่พวกเขาวิ่งมาหาฉันด้วยความสยดสยอง และบอกว่าตัวควบคุมกำลังสองเชิงเส้นเป็นสิ่งที่แย่ที่คุณจะไม่มีวันเชี่ยวชาญในชีวิตของคุณคือ วิธีกำลังสองน้อยที่สุด- คุณสามารถตัดสินใจ สมการเชิงเส้น- หากคุณกำลังอ่านข้อความนี้อยู่ก็มีแนวโน้มว่าจะไม่
ดังนั้น เมื่อพิจารณาจากจุดสองจุด (x0, y0), (x1, y1) เช่น (1,1) และ (3,2) ภารกิจคือการหาสมการของเส้นตรงที่ผ่านจุดสองจุดนี้:
ภาพประกอบ
บรรทัดนี้ควรมีสมการดังต่อไปนี้:
ที่นี่เราไม่รู้จักอัลฟ่าและเบต้า แต่ทราบสองประเด็นของบรรทัดนี้:
เราสามารถเขียนสมการนี้ในรูปแบบเมทริกซ์:
ที่นี่เราควรพูดนอกเรื่องโคลงสั้น ๆ: เมทริกซ์คืออะไร? เมทริกซ์ไม่มีอะไรมากไปกว่าอาร์เรย์สองมิติ นี่เป็นวิธีการจัดเก็บข้อมูล ไม่ควรแนบความหมายเพิ่มเติมเข้าไปด้วย ขึ้นอยู่กับเราว่าจะตีความเมทริกซ์บางตัวอย่างไร ผมจะตีความเป็นระยะๆ ว่าเป็นการแมปเชิงเส้น เป็นระยะๆ เป็นรูปกำลังสอง และบางครั้งก็เป็นเพียงเซตของเวกเตอร์ ทั้งหมดนี้จะมีการชี้แจงในบริบท
ลองแทนที่เมทริกซ์คอนกรีตด้วยการแสดงเชิงสัญลักษณ์:
จากนั้น (อัลฟ่า, เบต้า) สามารถพบได้ง่าย:
โดยเฉพาะอย่างยิ่งสำหรับข้อมูลก่อนหน้าของเรา:
ซึ่งนำไปสู่สมการของเส้นที่ผ่านจุด (1,1) และ (3,2) ต่อไปนี้:
โอเคทุกอย่างชัดเจนที่นี่ ลองหาสมการของเส้นที่ผ่าน สามคะแนน: (x0,y0), (x1,y1) และ (x2,y2):
โอ้ โอ้ แต่เรามีสมการสามสมการสำหรับสิ่งไม่รู้สองตัว! นักคณิตศาสตร์มาตรฐานจะบอกว่าไม่มีวิธีแก้ปัญหา โปรแกรมเมอร์จะว่าอย่างไร? และเขาจะเขียนระบบสมการก่อนหน้านี้ใหม่ในรูปแบบต่อไปนี้:
ในกรณีของเรา เวกเตอร์ i,j,bสามมิติ ดังนั้น (ใน กรณีทั่วไป) ไม่มีวิธีแก้ไขสำหรับระบบนี้ เวกเตอร์ใดๆ (alpha\*i + beta\*j) อยู่ในระนาบที่ทอดโดยเวกเตอร์ (i, j) ถ้า b ไม่ได้อยู่ในระนาบนี้ แสดงว่าไม่มีทางแก้ (สมการไม่สามารถบรรลุความเท่าเทียมกันได้) จะทำอย่างไร? ลองมองหาการประนีประนอม เรามาแสดงแทนด้วย อี(อัลฟา, เบต้า)เราไม่สามารถบรรลุถึงความเท่าเทียมกันได้ไกลแค่ไหน:
และเราจะพยายามลดข้อผิดพลาดนี้ให้เหลือน้อยที่สุด:
ทำไมต้องเหลี่ยม?
เราไม่ได้มองหาแค่ค่าขั้นต่ำของบรรทัดฐานเท่านั้น แต่ยังมองหาค่าขั้นต่ำของค่ากำลังสองของค่ามาตรฐานอีกด้วย ทำไม จุดต่ำสุดนั้นเกิดขึ้นพร้อมกัน และกำลังสองให้ฟังก์ชันที่ราบรื่น (ฟังก์ชันกำลังสองของอาร์กิวเมนต์ (อัลฟา, เบตา)) ในขณะที่ความยาวเพียงอย่างเดียวให้ฟังก์ชันรูปทรงกรวย ซึ่งหาความแตกต่างไม่ได้ที่จุดต่ำสุด บร. สี่เหลี่ยมจะสะดวกกว่า
แน่นอนว่าข้อผิดพลาดจะลดลงเมื่อเวกเตอร์ จตั้งฉากกับระนาบที่ทอดโดยเวกเตอร์ ฉันและ เจ.
ภาพประกอบ
กล่าวอีกนัยหนึ่ง: เรากำลังมองหาเส้นตรงที่ทำให้ผลรวมของความยาวกำลังสองของระยะทางจากจุดทั้งหมดถึงเส้นตรงนี้มีค่าน้อยที่สุด:
อัปเดต: ฉันมีปัญหาที่นี่ ควรวัดระยะห่างถึงเส้นตรงในแนวตั้ง ไม่ใช่ การฉายภาพมุมฉาก- นักวิจารณ์คนนี้พูดถูก
ภาพประกอบ
ในคำที่แตกต่างกันโดยสิ้นเชิง (อย่างระมัดระวัง มีรูปแบบที่ไม่ดี แต่ควรชัดเจน): เราจะนำเส้นที่เป็นไปได้ทั้งหมดระหว่างจุดทุกคู่และมองหาเส้นค่าเฉลี่ยระหว่างทั้งหมด:
ภาพประกอบ
คำอธิบายอีกประการหนึ่งตรงไปตรงมา: เราแนบสปริงระหว่างจุดข้อมูลทั้งหมด (ในที่นี้เรามีสามจุด) กับเส้นตรงที่เรากำลังมองหา และเส้นตรงของสถานะสมดุลคือสิ่งที่เรากำลังมองหา
รูปแบบกำลังสองขั้นต่ำ
แล้วให้เวกเตอร์นี้มา ขและระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ ก(ในกรณีนี้ (x0,x1,x2) และ (1,1,1)) เรากำลังมองหาเวกเตอร์ จด้วยความยาวกำลังสองขั้นต่ำ แน่นอนว่าค่าต่ำสุดสามารถทำได้สำหรับเวกเตอร์เท่านั้น จตั้งฉากกับระนาบที่สแปนโดยเวกเตอร์คอลัมน์ของเมทริกซ์ ก:กล่าวอีกนัยหนึ่ง เรากำลังมองหาเวกเตอร์ x=(alpha, beta) ดังนี้:
ผมขอเตือนคุณว่าเวกเตอร์นี้ x=(อัลฟา, เบต้า) เป็นค่าต่ำสุด ฟังก์ชันกำลังสอง||e(อัลฟา เบต้า)||^2:
ในที่นี้จะมีประโยชน์ที่จะจำไว้ว่าเมทริกซ์สามารถแปลเป็นรูปแบบกำลังสองได้เช่นกัน ตัวอย่างเช่น เมทริกซ์เอกลักษณ์ ((1,0),(0,1)) สามารถตีความได้ว่าเป็นฟังก์ชัน x^2 + y^ 2:
รูปแบบกำลังสอง
ยิมนาสติกทั้งหมดนี้รู้จักกันในชื่อการถดถอยเชิงเส้น
สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์
ตอนนี้งานจริงที่ง่ายที่สุด: มีพื้นผิวรูปสามเหลี่ยมบางอย่างจำเป็นต้องทำให้เรียบ ตัวอย่างเช่น ลองโหลดแบบจำลองใบหน้าของฉัน:คอมมิตดั้งเดิมพร้อมใช้งาน เพื่อย่อให้เล็กสุด การพึ่งพาภายนอกฉันเอาโค้ดของซอฟต์แวร์เรนเดอร์ของฉันไปที่Habréแล้ว สำหรับการแก้ปัญหา ระบบเชิงเส้นฉันใช้ OpenNL มันเป็นตัวแก้ปัญหาที่ยอดเยี่ยม แต่ติดตั้งได้ยากมาก: คุณต้องคัดลอกสองไฟล์ (.h+.c) ไปยังโฟลเดอร์ที่มีโปรเจ็กต์ของคุณ การปรับให้เรียบทั้งหมดทำได้ด้วยรหัสต่อไปนี้:
สำหรับ (int d=0; d<3; d++) {
nlNewContext();
nlSolverParameteri(NL_NB_VARIABLES, verts.size());
nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE);
nlBegin(NL_SYSTEM);
nlBegin(NL_MATRIX);
for (int i=0; i<(int)verts.size(); i++) {
nlBegin(NL_ROW);
nlCoefficient(i, 1);
nlRightHandSide(verts[i][d]);
nlEnd(NL_ROW);
}
for (unsigned int i=0; i
พิกัด X, Y และ Z แยกจากกันได้ ฉันปรับให้แยกกัน นั่นคือ ฉันแก้สมการเชิงเส้นสามระบบ โดยแต่ละระบบมีตัวแปรจำนวนหนึ่งเท่ากับจำนวนจุดยอดในแบบจำลองของฉัน n แถวแรกของเมทริกซ์ A มีเพียง 1 แถวต่อแถว และ n แถวแรกของเวกเตอร์ b มีพิกัดโมเดลดั้งเดิม นั่นคือฉันผูกสปริงระหว่างตำแหน่งใหม่ของจุดยอดกับตำแหน่งเก่าของจุดยอด - สปริงใหม่ไม่ควรเคลื่อนไปไกลจากจุดยอดเก่ามากเกินไป
แถวต่อมาทั้งหมดของเมทริกซ์ A (faces.size()*3 = จำนวนขอบของสามเหลี่ยมทั้งหมดในตาข่าย) มีการเกิด 1 ครั้งและเกิดขึ้น 1 ครั้งคือ -1 โดยเวกเตอร์ b มีองค์ประกอบเป็นศูนย์ตรงข้ามกัน ซึ่งหมายความว่าฉันวางสปริงไว้ที่ขอบแต่ละด้านของตาข่ายสามเหลี่ยมของเรา: ขอบทั้งหมดพยายามให้จุดยอดเดียวกันกับจุดเริ่มต้นและจุดสิ้นสุด
อีกครั้งหนึ่ง: จุดยอดทั้งหมดเป็นตัวแปร และไม่สามารถเคลื่อนไปไกลจากตำแหน่งเดิมได้ แต่ในขณะเดียวกัน จุดยอดก็พยายามที่จะคล้ายกัน
นี่คือผลลัพธ์:
ทุกอย่างจะเรียบร้อยดี ตัวแบบมีความเรียบเนียนมาก แต่มันขยับออกไปจากขอบเดิม มาเปลี่ยนรหัสกันหน่อย:
สำหรับ (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }
ในเมทริกซ์ A ของเรา สำหรับจุดยอดที่อยู่บนขอบ ฉันไม่ได้เพิ่มแถวจากหมวดหมู่ v_i = verts[i][d] แต่เพิ่ม 1,000*v_i = 1,000*verts[i][d] มันเปลี่ยนแปลงอะไร? และนี่เปลี่ยนรูปแบบข้อผิดพลาดกำลังสองของเรา ตอนนี้ค่าเบี่ยงเบนเดียวจากด้านบนที่ขอบจะไม่มีราคาหนึ่งหน่วยเหมือนเมื่อก่อน แต่ราคา 1,000*1,000 หน่วย นั่นคือเราแขวนสปริงที่แข็งแรงกว่าไว้บนจุดยอดสุดขั้ว วิธีแก้ปัญหาจะชอบที่จะยืดสปริงที่เหลือให้แรงกว่า นี่คือผลลัพธ์:
เพิ่มความแรงของสปริงระหว่างจุดยอดเป็นสองเท่า:
nlค่าสัมประสิทธิ์(หน้า[ j ], 2); nlค่าสัมประสิทธิ์(หน้า[(j+1)%3], -2);
เป็นเหตุผลที่พื้นผิวเรียบขึ้น:
และตอนนี้แข็งแกร่งขึ้นอีกร้อยเท่า:
นี่คืออะไร? ลองนึกภาพว่าเราจุ่มวงแหวนลวดลงในน้ำสบู่ เป็นผลให้ฟิล์มสบู่ที่ได้จะพยายามมีความโค้งน้อยที่สุดเท่าที่จะทำได้โดยสัมผัสกับขอบ - วงแหวนลวดของเรา นี่คือสิ่งที่เราได้จากการแก้ไขขอบและขอให้มีพื้นผิวเรียบภายใน ยินดีด้วย เราเพิ่งแก้สมการลาปลาซกับเงื่อนไขขอบเขตดิริชเลต์ได้ ฟังดูดีนะ? แต่ในความเป็นจริง คุณแค่ต้องแก้สมการเชิงเส้นระบบเดียว
สมการของปัวซอง
จำชื่อเจ๋ง ๆ อีกอันหนึ่งสมมติว่าฉันมีภาพเช่นนี้:
ดูดีสำหรับทุกคน แต่ฉันไม่ชอบเก้าอี้
ฉันจะตัดภาพออกครึ่งหนึ่ง:
และฉันจะเลือกเก้าอี้ด้วยมือของฉัน:
จากนั้นฉันจะดึงทุกอย่างที่เป็นสีขาวในหน้ากากไปทางด้านซ้ายของภาพ และในเวลาเดียวกันตลอดทั้งภาพ ฉันจะบอกว่าความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันควรจะเท่ากับความแตกต่างระหว่างสองพิกเซลที่อยู่ติดกันทางด้านขวา รูปภาพ:
สำหรับ (int i=0; i นี่คือผลลัพธ์: ฉันมีรูปถ่ายตัวอย่างผ้าจำนวนหนึ่งดังนี้: งานของฉันคือสร้างพื้นผิวที่ไร้รอยต่อจากภาพถ่ายคุณภาพนี้ ในการเริ่มต้น ฉัน (โดยอัตโนมัติ) มองหารูปแบบการทำซ้ำ: หากฉันตัดรูปสี่เหลี่ยมนี้ออกตรงๆ เนื่องจากความบิดเบี้ยว ขอบจึงไม่บรรจบกัน นี่คือตัวอย่างของรูปแบบที่ทำซ้ำสี่ครั้ง: ข้อความที่ซ่อนอยู่ นี่คือส่วนที่มองเห็นตะเข็บได้ชัดเจน: ดังนั้นฉันจะไม่ตัดเป็นเส้นตรง นี่คือเส้นตัด: ข้อความที่ซ่อนอยู่ และนี่คือรูปแบบที่ทำซ้ำสี่ครั้ง: ข้อความที่ซ่อนอยู่ และขอชี้แจงให้ชัดเจนยิ่งขึ้นว่า ดีกว่าอยู่แล้ว การตัดไม่เป็นเส้นตรง หลีกเลี่ยงการหยิกทุกประเภท แต่ตะเข็บยังคงมองเห็นได้เนื่องจากแสงที่ไม่สม่ำเสมอในภาพถ่ายต้นฉบับ นี่คือจุดที่วิธีกำลังสองน้อยที่สุดสำหรับสมการปัวซองช่วยได้ นี่คือผลลัพธ์สุดท้ายหลังจากปรับระดับแสง: พื้นผิวกลายเป็นไร้รอยต่ออย่างสมบูรณ์แบบ และทั้งหมดนี้โดยอัตโนมัติจากภาพถ่ายคุณภาพปานกลางมาก อย่ากลัวคณิตศาสตร์ หาคำอธิบายง่ายๆ แล้วคุณจะมีความสุขในวิชาวิศวกรรม ซึ่งพบการประยุกต์อย่างกว้างขวางที่สุดในสาขาวิทยาศาสตร์และกิจกรรมเชิงปฏิบัติที่หลากหลาย นี่อาจจะเป็นฟิสิกส์ เคมี ชีววิทยา เศรษฐศาสตร์ สังคมวิทยา จิตวิทยา และอื่นๆ อีกมากมาย ตามความประสงค์ของโชคชะตาฉันมักจะต้องรับมือกับเศรษฐกิจดังนั้นวันนี้ฉันจะจัดทริปให้คุณไปยังประเทศที่น่าอัศจรรย์ที่เรียกว่า เศรษฐมิติ=) ...จะไม่อยากได้ได้ยังไง! ที่นั่นดีมาก คุณแค่ต้องตัดสินใจ! ...แต่สิ่งที่คุณอาจต้องการอย่างแน่นอนคือการเรียนรู้วิธีการแก้ปัญหา วิธีกำลังสองน้อยที่สุด- และโดยเฉพาะอย่างยิ่งผู้อ่านที่ขยันจะได้เรียนรู้ที่จะแก้ปัญหาเหล่านี้ไม่เพียง แต่ถูกต้อง แต่ยังเร็วมาก ;-) แต่ก่อนอื่น คำแถลงทั่วไปของปัญหา+ ตัวอย่างประกอบ: ให้เราศึกษาตัวบ่งชี้ในสาขาวิชาเฉพาะที่มีการแสดงออกเชิงปริมาณ ในขณะเดียวกัน ก็มีเหตุผลทุกประการที่ทำให้เชื่อได้ว่าตัวบ่งชี้นั้นขึ้นอยู่กับตัวบ่งชี้นั้น สมมติฐานนี้สามารถเป็นได้ทั้งสมมติฐานทางวิทยาศาสตร์หรือตามสามัญสำนึกขั้นพื้นฐาน อย่างไรก็ตาม ทิ้งวิทยาศาสตร์ไปซะ แล้วมาสำรวจเรื่องน่ารับประทานอื่นๆ กันดีกว่า เช่น ร้านขายของชำ มาแสดงโดย: – พื้นที่ค้าปลีกของร้านขายของชำ ตร.ม. เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งพื้นที่ร้านค้ามีขนาดใหญ่ขึ้น ในกรณีส่วนใหญ่มูลค่าการซื้อขายก็จะมากขึ้นตามไปด้วย สมมติว่าหลังจากดำเนินการสังเกต/ทดลอง/คำนวณ/เต้นรำด้วยแทมบูรีน เราก็มีข้อมูลตัวเลขพร้อมใช้: ข้อมูลแบบตารางสามารถเขียนในรูปแบบของจุดและแสดงในรูปแบบที่คุ้นเคยได้ ระบบคาร์ทีเซียน . มาตอบคำถามสำคัญกัน: การศึกษาเชิงคุณภาพต้องใช้คะแนนกี่คะแนน? ใหญ่กว่าดีกว่า. ชุดขั้นต่ำที่ยอมรับได้ประกอบด้วย 5-6 คะแนน นอกจากนี้ เมื่อข้อมูลมีน้อย ผลลัพธ์ที่ "ผิดปกติ" ก็ไม่สามารถรวมไว้ในตัวอย่างได้ ตัวอย่างเช่น ร้านค้าชั้นนำขนาดเล็กสามารถรับคำสั่งซื้อที่มีขนาดมากกว่า "เพื่อนร่วมงาน" ดังนั้นจึงบิดเบือนรูปแบบทั่วไปที่คุณต้องค้นหา! พูดง่ายๆ ก็คือ เราต้องเลือกฟังก์ชัน กำหนดการซึ่งผ่านไปใกล้จุดมากที่สุด - ฟังก์ชันนี้เรียกว่า โดยประมาณ
(การประมาณ - การประมาณ)หรือ ฟังก์ชันทางทฤษฎี
- โดยทั่วไปแล้ว "คู่แข่ง" ที่ชัดเจนจะปรากฏขึ้นที่นี่ทันที - พหุนามระดับสูงซึ่งกราฟจะผ่านจุดทั้งหมด แต่ตัวเลือกนี้ซับซ้อนและมักจะไม่ถูกต้อง (เนื่องจากกราฟจะ “วนซ้ำ” ตลอดเวลาและสะท้อนแนวโน้มหลักได้ไม่ดี). ดังนั้นฟังก์ชันที่ต้องการจะต้องค่อนข้างง่ายและในขณะเดียวกันก็สะท้อนถึงการพึ่งพาอย่างเพียงพอ ดังที่คุณอาจเดาได้ มีการเรียกวิธีหนึ่งในการค้นหาฟังก์ชันดังกล่าว วิธีกำลังสองน้อยที่สุด- ก่อนอื่นเรามาดูสาระสำคัญของมันในแง่ทั่วไปกันก่อน ให้ฟังก์ชันบางอย่างแสดงข้อมูลการทดลองโดยประมาณ: หรือยุบ: (เผื่อใครไม่รู้: – นี่คือไอคอนผลรวม และ – ตัวแปร “ตัวนับ” เสริม ซึ่งรับค่าตั้งแต่ 1 ถึง ). โดยการประมาณคะแนนการทดลองที่มีฟังก์ชันต่างกัน เราจะได้ค่าที่แตกต่างกัน และแน่นอนว่าเมื่อผลรวมน้อยกว่า ฟังก์ชันนั้นก็จะแม่นยำมากขึ้น มีวิธีการดังกล่าวอยู่และเรียกว่า วิธีโมดูลัสน้อยที่สุด- อย่างไรก็ตามในทางปฏิบัติก็มีแพร่หลายมากขึ้น วิธีกำลังสองน้อยที่สุดซึ่งค่าลบที่เป็นไปได้ไม่ได้ถูกกำจัดโดยโมดูล แต่โดยการยกกำลังสองส่วนเบี่ยงเบน: หลังจากนั้นความพยายามมุ่งเป้าไปที่การเลือกฟังก์ชันดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุดเท่าที่จะเป็นไปได้ ที่จริงแล้วนี่คือที่มาของชื่อของวิธีการ และตอนนี้เรากลับมาที่จุดสำคัญอื่น: ตามที่ระบุไว้ข้างต้นฟังก์ชั่นที่เลือกควรจะค่อนข้างง่าย - แต่ก็มีฟังก์ชั่นดังกล่าวมากมายเช่นกัน: เชิงเส้น
, ซึ่งเกินความจริง, เอ็กซ์โปเนนเชียล, ลอการิทึม, กำลังสอง
ฯลฯ และแน่นอนว่า ณ ที่นี้ ฉันต้องการ "ลดขอบเขตของกิจกรรม" ทันที ฉันควรเลือกฟังก์ชันประเภทใดเพื่อการวิจัย? เทคนิคดั้งเดิมแต่มีประสิทธิภาพ: – วิธีที่ง่ายที่สุดคือการพรรณนาจุดต่างๆ บนภาพวาดและวิเคราะห์ตำแหน่งของพวกเขา หากมีแนวโน้มที่จะวิ่งเป็นเส้นตรง คุณก็ควรมองหา สมการของเส้น ด้วยค่าที่เหมาะสมที่สุดและ กล่าวอีกนัยหนึ่ง ภารกิจคือการหาค่าสัมประสิทธิ์ดังกล่าวเพื่อให้ผลรวมของการเบี่ยงเบนกำลังสองมีค่าน้อยที่สุด หากจุดต่างๆ อยู่ เช่น ตามแนว อติพจน์เห็นได้ชัดว่าฟังก์ชันเชิงเส้นจะให้การประมาณที่ไม่ดี ในกรณีนี้ เรากำลังมองหาสัมประสิทธิ์ที่ "เหมาะสม" ที่สุดสำหรับสมการไฮเปอร์โบลา – พวกที่ให้ผลรวมกำลังสองขั้นต่ำ . โปรดทราบว่าในทั้งสองกรณีเรากำลังพูดถึง ฟังก์ชันของตัวแปรสองตัวซึ่งมีข้อโต้แย้งอยู่ ค้นหาพารามิเตอร์การพึ่งพา: และโดยพื้นฐานแล้ว เราจำเป็นต้องแก้ปัญหามาตรฐาน - หา ฟังก์ชันขั้นต่ำของตัวแปรสองตัว. ลองจำตัวอย่างของเรา: สมมติว่าจุด "ร้านค้า" มักจะอยู่ในแนวเส้นตรงและมีเหตุผลทุกประการที่เชื่อได้ว่ามีอยู่จริง การพึ่งพาเชิงเส้นมูลค่าการซื้อขายจากพื้นที่ค้าปลีก ลองหาค่าสัมประสิทธิ์ "a" และ "be" ดังกล่าวซึ่งผลรวมของการเบี่ยงเบนกำลังสอง มีขนาดเล็กที่สุด ทุกอย่างเป็นไปตามปกติ - ก่อนอื่น อนุพันธ์ย่อยอันดับ 1- ตาม กฎความเป็นเส้นตรงคุณสามารถแยกความแตกต่างได้ภายใต้ไอคอนผลรวม: หากคุณต้องการใช้ข้อมูลนี้สำหรับเรียงความหรือภาคเรียน ฉันจะขอบคุณมากสำหรับลิงก์ในรายการแหล่งที่มา คุณจะพบการคำนวณโดยละเอียดในไม่กี่แห่ง: มาสร้างระบบมาตรฐานกัน: เราลดแต่ละสมการลง "สอง" และนอกจากนี้ "แยก" ผลรวม: บันทึก
: วิเคราะห์อย่างอิสระว่าเหตุใดจึงนำ "a" และ "be" ออกไปนอกเหนือจากไอคอนผลรวม อย่างไรก็ตาม อย่างเป็นทางการสามารถทำได้ด้วยผลรวม มาเขียนระบบใหม่ในรูปแบบ "นำไปใช้": เรารู้พิกัดของจุดต่างๆ ไหม? พวกเรารู้. จำนวนเงิน เราจะหามันเจอไหม? อย่างง่ายดาย. มาทำให้ง่ายที่สุดกันดีกว่า ระบบสมการเชิงเส้นสองสมการในสองไม่ทราบ(“ก” และ “เป็น”) เราแก้ระบบ เช่น วิธีการของแครมเมอร์ซึ่งเป็นผลมาจากการที่เราได้จุดที่อยู่นิ่ง กำลังตรวจสอบ สภาพที่เพียงพอสำหรับสุดขั้วเราสามารถตรวจสอบได้ว่า ณ จุดนี้ฟังก์ชัน บรรลุผลอย่างแน่นอน ขั้นต่ำ- การตรวจสอบเกี่ยวข้องกับการคำนวณเพิ่มเติม ดังนั้นเราจะละทิ้งการตรวจสอบไว้เบื้องหลัง (หากจำเป็นสามารถดูเฟรมที่หายไปได้)- เราได้ข้อสรุปสุดท้าย: การทำงาน วิธีที่ดีที่สุด (อย่างน้อยเมื่อเปรียบเทียบกับฟังก์ชันเชิงเส้นอื่นๆ)นำจุดทดลองเข้ามาใกล้ยิ่งขึ้น - หากพูดโดยคร่าวๆ กราฟของมันจะผ่านไปใกล้จุดเหล่านี้มากที่สุดเท่าที่จะเป็นไปได้ ในประเพณี เศรษฐมิติฟังก์ชันการประมาณผลลัพธ์จะเรียกอีกอย่างว่า สมการถดถอยเชิงเส้นคู่
. ปัญหาที่อยู่ระหว่างการพิจารณามีความสำคัญอย่างยิ่งในทางปฏิบัติ ในสถานการณ์ตัวอย่างของเรา สมการ ช่วยให้คุณสามารถคาดการณ์มูลค่าการซื้อขายได้ ("อิเกรก")ร้านค้าจะมีค่าพื้นที่ขายอย่างน้อยหนึ่งค่า (ความหมายอย่างใดอย่างหนึ่งของ “x”)- ใช่ ผลการพยากรณ์จะเป็นเพียงการคาดการณ์เท่านั้น แต่ในหลายกรณีกลับกลายเป็นว่าค่อนข้างแม่นยำ ฉันจะวิเคราะห์ปัญหาเดียวด้วยตัวเลข "จริง" เนื่องจากไม่มีปัญหาในนั้น - การคำนวณทั้งหมดอยู่ในระดับหลักสูตรของโรงเรียนชั้นประถมศึกษาปีที่ 7-8 ในกรณี 95 เปอร์เซ็นต์ คุณจะถูกขอให้ค้นหาฟังก์ชันเชิงเส้น แต่ในตอนท้ายของบทความ ผมจะแสดงให้เห็นว่าการค้นหาสมการของไฮเปอร์โบลา เลขชี้กำลัง และฟังก์ชันอื่นๆ ที่เหมาะสมที่สุดนั้นไม่ใช่เรื่องยากอีกต่อไป ในความเป็นจริงสิ่งที่เหลืออยู่คือการแจกจ่ายสารพัดที่สัญญาไว้ - เพื่อให้คุณสามารถเรียนรู้ที่จะแก้ไขตัวอย่างดังกล่าวไม่เพียง แต่แม่นยำ แต่ยังรวดเร็วอีกด้วย เราศึกษามาตรฐานอย่างรอบคอบ: งาน จากการศึกษาความสัมพันธ์ระหว่างตัวชี้วัด 2 ตัว พบว่าได้ตัวเลขคู่ดังนี้ โปรดทราบว่าความหมาย "x" เป็นไปตามธรรมชาติและนี่มีความหมายที่มีความหมายซึ่งฉันจะพูดถึงในภายหลัง แต่แน่นอนว่าพวกมันสามารถเป็นเศษส่วนได้เช่นกัน นอกจากนี้ขึ้นอยู่กับเนื้อหาของงานเฉพาะทั้งค่า "X" และ "เกม" อาจเป็นค่าลบทั้งหมดหรือบางส่วนก็ได้ เราได้รับภารกิจที่ "ไร้หน้า" และเราเริ่มต้นมันได้ สารละลาย: เราค้นหาค่าสัมประสิทธิ์ของฟังก์ชันที่เหมาะสมที่สุดเป็นวิธีแก้ปัญหาของระบบ: เพื่อวัตถุประสงค์ในการบันทึกที่มีขนาดกะทัดรัดมากขึ้น สามารถละเว้นตัวแปร "ตัวนับ" ได้ เนื่องจากเป็นที่แน่ชัดแล้วว่าการรวมจะดำเนินการตั้งแต่ 1 ถึง สะดวกกว่าในการคำนวณจำนวนเงินที่ต้องการในรูปแบบตาราง:
ดังนั้นเราจึงได้สิ่งต่อไปนี้ ระบบ: ที่นี่คุณสามารถคูณสมการที่สองด้วย 3 และ ลบอันที่ 2 จากเทอมของสมการที่ 1 ทีละเทอม- แต่นี่คือโชค - ในทางปฏิบัติ ระบบมักไม่ใช่ของขวัญ และในกรณีเช่นนี้ ระบบจะช่วยประหยัดได้ วิธีการของแครมเมอร์: มาตรวจสอบกัน ฉันเข้าใจว่าคุณไม่ต้องการ แต่ทำไมต้องข้ามข้อผิดพลาดโดยที่ไม่ควรพลาดอย่างแน่นอน ให้เราแทนที่คำตอบที่พบทางด้านซ้ายของแต่ละสมการของระบบ: ดังนั้นฟังก์ชันการประมาณที่ต้องการ: – จาก ฟังก์ชันเชิงเส้นทั้งหมดเธอคือผู้ที่ประมาณข้อมูลการทดลองได้ดีที่สุด ไม่เหมือน ตรง
การพึ่งพาการหมุนเวียนของร้านค้าในพื้นที่ การพึ่งพาอาศัยกันที่พบคือ ย้อนกลับ
(หลักการ “ยิ่งมาก ยิ่งน้อย”)และความจริงเรื่องนี้ก็ถูกเปิดเผยทันทีในแง่ลบ ความลาดชัน- การทำงาน บอกเราว่าเมื่อเพิ่มตัวบ่งชี้บางตัวขึ้น 1 หน่วย ค่าของตัวบ่งชี้ตามจะลดลง เฉลี่ยเพิ่มขึ้น 0.65 หน่วย อย่างที่พวกเขาพูดกันว่าราคาบัควีทยิ่งสูงเท่าไหร่ก็ยิ่งขายได้น้อยลงเท่านั้น หากต้องการพล็อตฟังก์ชันการประมาณ ลองหาค่าสองค่าของมัน: และดำเนินการวาดภาพ: ลองคำนวณผลรวมของการเบี่ยงเบนกำลังสองกัน ระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ในเชิงเรขาคณิต นี่คือผลรวมของกำลังสองของความยาวของส่วน "ราสเบอร์รี่" (สองอันมีขนาดเล็กมากจนมองไม่เห็นด้วยซ้ำ). สรุปการคำนวณในตาราง:
เราทำซ้ำอีกครั้ง: ความหมายของผลลัพธ์ที่ได้รับคืออะไร?จาก ฟังก์ชันเชิงเส้นทั้งหมดฟังก์ชัน y ตัวบ่งชี้นั้นเล็กที่สุดนั่นคือในตระกูลมันเป็นค่าประมาณที่ดีที่สุด และที่นี่ คำถามสุดท้ายของปัญหาไม่ใช่เรื่องบังเอิญ: จะเกิดอะไรขึ้นถ้าฟังก์ชันเอ็กซ์โปเนนเชียลที่เสนอมา จะดีกว่าไหมถ้านำจุดทดลองเข้ามาใกล้มากขึ้น? มาหาผลรวมของการเบี่ยงเบนกำลังสองที่สอดคล้องกัน - เพื่อแยกแยะฉันจะเขียนแทนด้วยตัวอักษร "เอปไซลอน" เทคนิคเหมือนกันทุกประการ: บทสรุป: ซึ่งหมายความว่าฟังก์ชันเอ็กซ์โพเนนเชียลจะประมาณจุดการทดลองที่แย่กว่าเส้นตรง . แต่ที่นี่ควรสังเกตว่า "แย่กว่า" คือ ยังไม่ได้หมายความว่า, เกิดอะไรขึ้น. ตอนนี้ ฉันได้สร้างกราฟของฟังก์ชันเอ็กซ์โพเนนเชียลนี้แล้ว และกราฟยังส่งผ่านใกล้กับจุดต่างๆ ด้วย - มากเสียจนหากไม่มีการวิจัยเชิงวิเคราะห์ก็ยากที่จะบอกว่าฟังก์ชันใดแม่นยำกว่า นี่เป็นการสรุปวิธีแก้ปัญหาและฉันกลับไปสู่คำถามเกี่ยวกับคุณค่าตามธรรมชาติของการโต้แย้ง ในการศึกษาต่างๆ โดยทั่วไปแล้ว "X's" โดยทั่วไปทางเศรษฐกิจหรือสังคมวิทยาจะใช้เพื่อนับเดือน ปี หรือช่วงเวลาอื่นๆ ที่เท่ากัน ลองพิจารณาปัญหาต่อไปนี้เป็นตัวอย่าง วิธีหนึ่งในการศึกษาความสัมพันธ์แบบสุ่มระหว่างคุณลักษณะคือการวิเคราะห์การถดถอย ส่วนใหญ่มักใช้ในการประมาณค่าพารามิเตอร์ วิธีกำลังสองน้อยที่สุด (LSM)
ปัญหาการประมาณค่าพารามิเตอร์ของสมการคู่เชิงเส้นโดยใช้วิธีกำลังสองน้อยที่สุดมีดังต่อไปนี้: เพื่อให้ได้ค่าประมาณของพารามิเตอร์ ซึ่งผลรวมของการเบี่ยงเบนกำลังสองของค่าที่แท้จริงของลักษณะผลลัพธ์ - y ฉัน จากค่าที่คำนวณได้ - มีค่าน้อยที่สุด เรามาอธิบายประเด็นกันดีกว่า วิธีกำลังสองน้อยที่สุดแบบคลาสสิกแบบกราฟิก- ในการดำเนินการนี้ เราจะสร้างแผนภูมิกระจายตามข้อมูลเชิงสังเกต (x i, y i, i=1;n) ในระบบพิกัดสี่เหลี่ยม (แผนภูมิกระจายดังกล่าวเรียกว่าฟิลด์สหสัมพันธ์) ลองเลือกเส้นตรงที่ใกล้กับจุดของสนามความสัมพันธ์มากที่สุด ตามวิธีกำลังสองน้อยที่สุด เส้นจะถูกเลือกเพื่อให้ผลรวมของกำลังสองของระยะทางแนวตั้งระหว่างจุดของเขตข้อมูลสหสัมพันธ์และเส้นนี้มีค่าน้อยที่สุด การประเมินความใกล้ชิดของความสัมพันธ์ระหว่างคุณลักษณะ
ดำเนินการโดยใช้สัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ - r x,y สามารถคำนวณได้โดยใช้สูตร: - นอกจากนี้ ค่าสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้นสามารถหาได้จากค่าสัมประสิทธิ์การถดถอย b: .
เพื่อประเมินคุณภาพของสมการการถดถอยที่เกิดขึ้น ให้คำนวณค่าสัมประสิทธิ์การกำหนดทางทฤษฎี - R 2 yx: ตัวอย่าง. ข้อมูลการทดลองเกี่ยวกับค่าของตัวแปร เอ็กซ์และ ที่จะได้รับในตาราง จากการจัดตำแหน่ง ทำให้ได้ฟังก์ชันมา โดยใช้ วิธีกำลังสองน้อยที่สุดประมาณข้อมูลเหล่านี้ด้วยการพึ่งพาเชิงเส้น y=ขวาน+ข(ค้นหาพารามิเตอร์ กและ ข- ค้นหาว่าบรรทัดใดในสองบรรทัดที่ดีกว่า (ในแง่ของวิธีกำลังสองน้อยที่สุด) เพื่อจัดแนวข้อมูลการทดลอง วาดรูป. ภารกิจคือการหาค่าสัมประสิทธิ์การพึ่งพาเชิงเส้นซึ่งเป็นฟังก์ชันของตัวแปรสองตัว กและ ข
ใช้ค่าที่น้อยที่สุด นั่นคือให้ กและ ขผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นตรงที่พบจะน้อยที่สุด นี่คือจุดรวมของวิธีกำลังสองน้อยที่สุด ดังนั้น การแก้ตัวอย่างจึงต้องหาจุดสิ้นสุดของฟังก์ชันของตัวแปรสองตัว ระบบสมการสองสมการที่ไม่ทราบค่าสองตัวจะถูกรวบรวมและแก้ไข การหาอนุพันธ์ย่อยของฟังก์ชัน โดยตัวแปร กและ ข, เราเปรียบอนุพันธ์เหล่านี้ให้เป็นศูนย์ เราแก้ระบบสมการผลลัพธ์โดยใช้วิธีใดก็ได้ (เช่น โดยวิธีทดแทนหรือ วิธีการของแครมเมอร์) และรับสูตรสำหรับการค้นหาสัมประสิทธิ์โดยใช้วิธีกำลังสองน้อยที่สุด (LSM) ที่ให้ไว้ กและ ขการทำงาน ใช้ค่าที่น้อยที่สุด มีการให้หลักฐานข้อเท็จจริงนี้ ด้านล่างในข้อความท้ายหน้า. นั่นคือวิธีทั้งหมดของกำลังสองน้อยที่สุด สูตรการหาพารามิเตอร์ กมีผลรวม ,, และพารามิเตอร์ n- จำนวนข้อมูลการทดลอง เราขอแนะนำให้คำนวณค่าของจำนวนเงินเหล่านี้แยกกัน ค่าสัมประสิทธิ์ ขพบได้หลังการคำนวณ ก. ถึงเวลาจำตัวอย่างดั้งเดิมแล้ว สารละลาย. ในตัวอย่างของเรา n=5- เรากรอกตารางเพื่อความสะดวกในการคำนวณจำนวนเงินที่รวมอยู่ในสูตรของค่าสัมประสิทธิ์ที่ต้องการ ค่าในแถวที่สี่ของตารางได้มาจากการคูณค่าของแถวที่ 2 ด้วยค่าของแถวที่ 3 สำหรับแต่ละตัวเลข ฉัน. ค่าในแถวที่ห้าของตารางได้มาจากการยกกำลังสองค่าในแถวที่ 2 สำหรับแต่ละตัวเลข ฉัน. ค่าในคอลัมน์สุดท้ายของตารางคือผลรวมของค่าระหว่างแถว เราใช้สูตรวิธีกำลังสองน้อยที่สุดเพื่อหาค่าสัมประสิทธิ์ กและ ข- เราแทนที่ค่าที่เกี่ยวข้องจากคอลัมน์สุดท้ายของตารางลงไป: เพราะฉะนั้น, y = 0.165x+2.184- เส้นตรงโดยประมาณที่ต้องการ มันยังคงค้นหาว่าเส้นไหน y = 0.165x+2.184หรือ ประมาณข้อมูลเดิมได้ดีกว่า กล่าวคือ ประมาณการโดยใช้วิธีกำลังสองน้อยที่สุด ในการทำเช่นนี้ คุณต้องคำนวณผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลต้นฉบับจากเส้นเหล่านี้ และ ค่าที่น้อยกว่าจะสอดคล้องกับเส้นที่ประมาณข้อมูลต้นฉบับได้ดีกว่าในแง่ของวิธีกำลังสองน้อยที่สุด ตั้งแต่นั้นมาตรง y = 0.165x+2.184ใกล้เคียงกับข้อมูลเดิมดีกว่า ทุกอย่างมองเห็นได้ชัดเจนบนกราฟ เส้นสีแดงคือเส้นตรงที่พบ y = 0.165x+2.184, เส้นสีน้ำเงินคือ จุดสีชมพูคือข้อมูลต้นฉบับ ในทางปฏิบัติเมื่อสร้างแบบจำลองกระบวนการต่าง ๆ โดยเฉพาะอย่างยิ่งทางเศรษฐกิจ กายภาพ เทคนิค สังคม - วิธีการหนึ่งหรือวิธีอื่นในการคำนวณค่าโดยประมาณของฟังก์ชันจากค่าที่ทราบที่จุดคงที่นั้นมีการใช้กันอย่างแพร่หลาย ปัญหาการประมาณฟังก์ชันประเภทนี้มักเกิดขึ้น: เมื่อสร้างสูตรโดยประมาณสำหรับการคำนวณค่าของปริมาณลักษณะเฉพาะของกระบวนการภายใต้การศึกษาโดยใช้ข้อมูลแบบตารางที่ได้รับจากการทดลอง ในการปริพันธ์เชิงตัวเลข การสร้างอนุพันธ์ การแก้สมการเชิงอนุพันธ์ ฯลฯ หากจำเป็นให้คำนวณค่าของฟังก์ชันที่จุดกึ่งกลางของช่วงเวลาที่พิจารณา เมื่อกำหนดค่าของปริมาณลักษณะเฉพาะของกระบวนการที่อยู่นอกช่วงเวลาที่พิจารณา โดยเฉพาะอย่างยิ่งเมื่อคาดการณ์ หากในการสร้างแบบจำลองกระบวนการบางอย่างที่ระบุโดยตาราง เราสร้างฟังก์ชันที่ประมาณอธิบายกระบวนการนี้โดยใช้วิธีกำลังสองน้อยที่สุด ฟังก์ชันดังกล่าวจะเรียกว่าฟังก์ชันการประมาณ (การถดถอย) และงานสร้างฟังก์ชันการประมาณจะถูกเรียกว่า ปัญหาการประมาณ บทความนี้กล่าวถึงความสามารถของแพ็คเกจ MS Excel ในการแก้ปัญหาประเภทนี้ นอกจากนี้ยังมีวิธีการและเทคนิคในการสร้าง (สร้าง) การถดถอยสำหรับฟังก์ชันแบบตาราง (ซึ่งเป็นพื้นฐานของการวิเคราะห์การถดถอย) Excel มีสองตัวเลือกสำหรับการสร้างการถดถอย การเพิ่มการถดถอยที่เลือก (เส้นแนวโน้ม) ลงในไดอะแกรมที่สร้างขึ้นบนพื้นฐานของตารางข้อมูลสำหรับคุณลักษณะกระบวนการภายใต้การศึกษา (ใช้ได้เฉพาะเมื่อมีการสร้างไดอะแกรมแล้ว) การใช้ฟังก์ชันทางสถิติในตัวของแผ่นงาน Excel ช่วยให้คุณสามารถรับการถดถอย (เส้นแนวโน้ม) ได้โดยตรงจากตารางข้อมูลต้นฉบับ การเพิ่มเส้นแนวโน้มลงในแผนภูมิ สำหรับตารางข้อมูลที่อธิบายกระบวนการและแสดงด้วยไดอะแกรม Excel มีเครื่องมือวิเคราะห์การถดถอยที่มีประสิทธิภาพซึ่งช่วยให้คุณ: สร้างบนพื้นฐานของวิธีกำลังสองน้อยที่สุดและเพิ่มการถดถอยห้าประเภทลงในแผนภาพ ซึ่งเป็นแบบจำลองกระบวนการภายใต้การศึกษาด้วยระดับความแม่นยำที่แตกต่างกัน เพิ่มสมการถดถอยที่สร้างขึ้นลงในแผนภาพ กำหนดระดับความสอดคล้องของการถดถอยที่เลือกกับข้อมูลที่แสดงบนแผนภูมิ จากข้อมูลแผนภูมิ Excel ช่วยให้คุณได้รับประเภทการถดถอยเชิงเส้น พหุนาม ลอการิทึม กำลัง และเลขชี้กำลัง ซึ่งระบุโดยสมการ: ย = ย(x) โดยที่ x เป็นตัวแปรอิสระที่มักจะรับค่าของลำดับของจำนวนธรรมชาติ (1; 2; 3; ...) และสร้างตัวอย่างเช่นการนับถอยหลังของเวลาของกระบวนการที่กำลังศึกษา (ลักษณะ) 1
- การถดถอยเชิงเส้นเป็นสิ่งที่ดีสำหรับลักษณะการสร้างแบบจำลองที่มีค่าเพิ่มขึ้นหรือลดลงในอัตราคงที่ นี่เป็นแบบจำลองที่ง่ายที่สุดในการสร้างสำหรับกระบวนการที่กำลังศึกษาอยู่ มันถูกสร้างขึ้นตามสมการ: y = mx + ข โดยที่ m คือแทนเจนต์ของความชันการถดถอยเชิงเส้นกับแกน x b - พิกัดของจุดตัดของการถดถอยเชิงเส้นกับแกนกำหนด 2
- เส้นแนวโน้มพหุนามมีประโยชน์สำหรับการอธิบายคุณลักษณะที่มีความสุดขั้วที่แตกต่างกันหลายประการ (ค่าสูงสุดและค่าต่ำสุด) การเลือกระดับพหุนามจะพิจารณาจากจำนวนสุดขั้วของลักษณะเฉพาะที่กำลังศึกษา ดังนั้น พหุนามดีกรีที่สองจึงสามารถอธิบายกระบวนการที่มีค่าสูงสุดหรือต่ำสุดเพียงค่าเดียวเท่านั้น พหุนามของระดับที่สาม - ไม่เกินสองสุดขั้ว; พหุนามของระดับที่สี่ - ไม่เกินสาม extrema เป็นต้น ในกรณีนี้ เส้นแนวโน้มจะถูกสร้างขึ้นตามสมการ: y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6 โดยที่ค่าสัมประสิทธิ์ c0, c1, c2,... c6 เป็นค่าคงที่ซึ่งมีการกำหนดค่าระหว่างการก่อสร้าง 3
- เส้นแนวโน้มลอการิทึมถูกนำมาใช้อย่างประสบความสำเร็จเมื่อสร้างแบบจำลองคุณลักษณะที่มีค่าเริ่มแรกเปลี่ยนแปลงอย่างรวดเร็วจากนั้นจึงค่อย ๆ มีเสถียรภาพ y = ค ln(x) + ข 4
- เส้นแนวโน้มกฎอำนาจให้ผลลัพธ์ที่ดีหากค่าของความสัมพันธ์ภายใต้การศึกษามีลักษณะเฉพาะด้วยการเปลี่ยนแปลงอัตราการเติบโตอย่างต่อเนื่อง ตัวอย่างของการพึ่งพาอาศัยกันคือกราฟของการเคลื่อนที่ด้วยความเร่งสม่ำเสมอของรถ หากข้อมูลมีค่าเป็นศูนย์หรือลบ คุณจะไม่สามารถใช้เส้นแนวโน้มกำลังได้ สร้างตามสมการ: y = ค xb โดยที่สัมประสิทธิ์ b, c เป็นค่าคงที่ 5
- ควรใช้เส้นแนวโน้มเอ็กซ์โพเนนเชียลเมื่ออัตราการเปลี่ยนแปลงข้อมูลเพิ่มขึ้นอย่างต่อเนื่อง สำหรับข้อมูลที่มีค่าเป็นศูนย์หรือค่าลบ การประมาณประเภทนี้จะใช้ไม่ได้เช่นกัน สร้างตามสมการ: y = ค ebx โดยที่สัมประสิทธิ์ b, c เป็นค่าคงที่ เมื่อเลือกเส้นแนวโน้ม Excel จะคำนวณค่า R2 โดยอัตโนมัติซึ่งจะระบุลักษณะความน่าเชื่อถือของการประมาณ: ยิ่งค่า R2 ใกล้ถึงเอกภาพมากเท่าใด เส้นแนวโน้มก็จะประมาณกระบวนการที่กำลังศึกษาได้อย่างน่าเชื่อถือมากขึ้นเท่านั้น หากจำเป็น ค่า R2 สามารถแสดงบนแผนภูมิได้ตลอดเวลา กำหนดโดยสูตร: หากต้องการเพิ่มเส้นแนวโน้มลงในชุดข้อมูล: เปิดใช้งานแผนภูมิตามชุดข้อมูล เช่น คลิกภายในพื้นที่แผนภูมิ รายการไดอะแกรมจะปรากฏในเมนูหลัก หลังจากคลิกที่รายการนี้ เมนูจะปรากฏขึ้นบนหน้าจอซึ่งคุณควรเลือกคำสั่งเพิ่มเส้นแนวโน้ม การดำเนินการเดียวกันนี้สามารถนำไปใช้ได้อย่างง่ายดายโดยเลื่อนตัวชี้เมาส์ไปเหนือกราฟที่สอดคล้องกับชุดข้อมูลชุดใดชุดหนึ่งแล้วคลิกขวา ในเมนูบริบทที่ปรากฏขึ้น ให้เลือกคำสั่งเพิ่มเส้นแนวโน้ม กล่องโต้ตอบ Trend Line จะปรากฏขึ้นบนหน้าจอโดยเปิดแท็บ Type ไว้ (รูปที่ 1) หลังจากนี้คุณจะต้อง: เลือกประเภทเส้นแนวโน้มที่ต้องการบนแท็บประเภท (ประเภทเชิงเส้นจะถูกเลือกตามค่าเริ่มต้น) สำหรับประเภทพหุนาม ในฟิลด์ องศา ให้ระบุระดับของพหุนามที่เลือก 1
- ช่องสร้างบนซีรีส์จะแสดงชุดข้อมูลทั้งหมดในแผนภูมิที่ต้องการ หากต้องการเพิ่มเส้นแนวโน้มให้กับชุดข้อมูลเฉพาะ ให้เลือกชื่อในช่องสร้างบนชุดข้อมูล หากจำเป็น โดยไปที่แท็บพารามิเตอร์ (รูปที่ 2) คุณสามารถตั้งค่าพารามิเตอร์ต่อไปนี้สำหรับเส้นแนวโน้ม: เปลี่ยนชื่อเส้นแนวโน้มในชื่อของฟิลด์เส้นโค้งโดยประมาณ (เรียบ) กำหนดจำนวนงวด (ไปข้างหน้าหรือข้างหลัง) สำหรับการพยากรณ์ในช่องพยากรณ์ แสดงสมการของเส้นแนวโน้มในพื้นที่ไดอะแกรม ซึ่งคุณควรเปิดใช้งานการแสดงสมการบนกล่องกาเครื่องหมายไดอะแกรม แสดงค่าความน่าเชื่อถือของการประมาณ R2 ในพื้นที่ไดอะแกรม ซึ่งคุณควรเปิดใช้งานช่องทำเครื่องหมาย วางค่าความน่าเชื่อถือของการประมาณบนไดอะแกรม (R^2) ตั้งค่าจุดตัดของเส้นแนวโน้มด้วยแกน Y ซึ่งคุณควรเปิดใช้งานช่องทำเครื่องหมายสำหรับจุดตัดของเส้นโค้งโดยมีแกน Y อยู่ที่จุด คลิกปุ่มตกลงเพื่อปิดกล่องโต้ตอบ ในการเริ่มแก้ไขเส้นแนวโน้มที่วาดไว้แล้ว มีสามวิธี: ใช้คำสั่งเส้นแนวโน้มที่เลือกจากเมนูรูปแบบ โดยเลือกเส้นแนวโน้มไว้ก่อนหน้านี้ เลือกคำสั่งจัดรูปแบบเส้นแนวโน้มจากเมนูบริบท ซึ่งเรียกขึ้นมาโดยการคลิกขวาที่เส้นแนวโน้ม ดับเบิลคลิกที่เส้นแนวโน้ม กล่องโต้ตอบรูปแบบเส้นแนวโน้มจะปรากฏบนหน้าจอ (รูปที่ 3) ซึ่งมีสามแท็บ: มุมมอง ประเภท พารามิเตอร์ และเนื้อหาของสองแท็บสุดท้ายตรงกับแท็บที่คล้ายกันของกล่องโต้ตอบเส้นแนวโน้ม (รูปที่ 1 -2) บนแท็บมุมมอง คุณสามารถตั้งค่าประเภทของเส้น สี และความหนาได้ หากต้องการลบเส้นแนวโน้มที่วาดไว้แล้ว ให้เลือกเส้นแนวโน้มที่จะลบแล้วกดปุ่ม Delete ข้อดีของเครื่องมือวิเคราะห์การถดถอยที่พิจารณาคือ: ความง่ายในการสร้างเส้นแนวโน้มบนแผนภูมิโดยไม่ต้องสร้างตารางข้อมูล รายการประเภทเส้นแนวโน้มที่นำเสนอที่ค่อนข้างกว้าง และรายการนี้รวมถึงประเภทการถดถอยที่ใช้บ่อยที่สุด ความสามารถในการทำนายพฤติกรรมของกระบวนการภายใต้การศึกษาโดยจำนวนก้าวไปข้างหน้าและข้างหลังโดยพลการ (ภายในขอบเขตของสามัญสำนึก) ความสามารถในการรับสมการเส้นแนวโน้มในรูปแบบการวิเคราะห์ ความเป็นไปได้ (หากจำเป็น) ในการประเมินความน่าเชื่อถือของการประมาณ ข้อเสียมีดังต่อไปนี้: การสร้างเส้นแนวโน้มจะดำเนินการเฉพาะในกรณีที่มีไดอะแกรมที่สร้างขึ้นจากชุดข้อมูล กระบวนการสร้างชุดข้อมูลสำหรับคุณลักษณะภายใต้การศึกษาตามสมการเส้นแนวโน้มที่ได้รับนั้นค่อนข้างยุ่งเหยิง: สมการการถดถอยที่ต้องการจะได้รับการอัปเดตพร้อมกับการเปลี่ยนแปลงแต่ละครั้งในค่าของชุดข้อมูลดั้งเดิม แต่เฉพาะภายในพื้นที่แผนภูมิเท่านั้น ในขณะที่ชุดข้อมูลที่สร้างขึ้นบนพื้นฐานของแนวโน้มสมการเส้นเก่ายังคงไม่เปลี่ยนแปลง ในรายงาน PivotChart การเปลี่ยนมุมมองของแผนภูมิหรือรายงาน PivotTable ที่เกี่ยวข้องจะไม่รักษาเส้นแนวโน้มที่มีอยู่ ซึ่งหมายความว่าก่อนที่คุณจะวาดเส้นแนวโน้มหรือจัดรูปแบบรายงาน PivotChart คุณควรตรวจสอบให้แน่ใจว่าเค้าโครงรายงานตรงตามข้อกำหนดที่จำเป็น เส้นแนวโน้มสามารถใช้เพื่อเสริมชุดข้อมูลที่นำเสนอบนแผนภูมิ เช่น กราฟ ฮิสโตแกรม แผนภูมิพื้นที่ที่ไม่เป็นมาตรฐานแบบเรียบ แผนภูมิแท่ง แผนภูมิกระจาย แผนภูมิฟอง และแผนภูมิหุ้น คุณไม่สามารถเพิ่มเส้นแนวโน้มลงในชุดข้อมูลในรูปแบบ 3 มิติ แผนภูมิปกติ แผนภูมิเรดาร์ แผนภูมิวงกลม และแผนภูมิโดนัทได้ การใช้ฟังก์ชันในตัวของ Excel Excel ยังมีเครื่องมือวิเคราะห์การถดถอยสำหรับการวางแผนเส้นแนวโน้มนอกพื้นที่แผนภูมิ มีฟังก์ชันเวิร์กชีททางสถิติจำนวนหนึ่งที่คุณสามารถใช้เพื่อจุดประสงค์นี้ได้ แต่ฟังก์ชันทั้งหมดอนุญาตให้คุณสร้างการถดถอยเชิงเส้นหรือเอ็กซ์โพเนนเชียลเท่านั้น Excel มีฟังก์ชันหลายอย่างสำหรับสร้างการถดถอยเชิงเส้น โดยเฉพาะ: แนวโน้ม; ความลาดชันและการตัด เช่นเดียวกับฟังก์ชันต่างๆ มากมายสำหรับการสร้างเส้นแนวโน้มเอ็กซ์โพเนนเชียล โดยเฉพาะ: LGRFRIBL. ควรสังเกตว่าเทคนิคในการสร้างการถดถอยโดยใช้ฟังก์ชัน TREND และ GROWTH เกือบจะเหมือนกัน สิ่งเดียวกันอาจกล่าวได้เกี่ยวกับคู่ของฟังก์ชัน LINEST และ LGRFPRIBL สำหรับฟังก์ชันทั้งสี่นี้ การสร้างตารางค่าจะใช้ฟีเจอร์ของ Excel เช่น สูตรอาร์เรย์ ซึ่งทำให้กระบวนการสร้างการถดถอยค่อนข้างเกะกะ โปรดทราบว่าในความคิดของเรา การสร้างการถดถอยเชิงเส้นนั้นทำได้ง่ายที่สุดโดยใช้ฟังก์ชัน SLOPE และ INTERCEPT โดยที่ฟังก์ชันแรกจะกำหนดความชันของการถดถอยเชิงเส้น และฟังก์ชันที่สองจะกำหนดส่วนที่ถูกดักจับโดยการถดถอยบน แกน y ข้อดีของเครื่องมือฟังก์ชันในตัวสำหรับการวิเคราะห์การถดถอยคือ: กระบวนการที่ค่อนข้างง่ายและสม่ำเสมอในการสร้างชุดข้อมูลของคุณลักษณะภายใต้การศึกษาสำหรับฟังก์ชันทางสถิติในตัวทั้งหมดที่กำหนดเส้นแนวโน้ม วิธีการมาตรฐานสำหรับการสร้างเส้นแนวโน้มตามชุดข้อมูลที่สร้างขึ้น ความสามารถในการทำนายพฤติกรรมของกระบวนการที่กำลังศึกษาตามจำนวนก้าวไปข้างหน้าหรือข้างหลังที่ต้องการ ข้อเสียรวมถึงข้อเท็จจริงที่ว่า Excel ไม่มีฟังก์ชันในตัวสำหรับการสร้างเส้นแนวโน้มประเภทอื่นๆ (ยกเว้นเชิงเส้นและเลขชี้กำลัง) สถานการณ์นี้มักไม่อนุญาตให้เลือกแบบจำลองกระบวนการที่กำลังศึกษาที่แม่นยำเพียงพอ รวมถึงการคาดการณ์ที่ใกล้เคียงกับความเป็นจริง นอกจากนี้ เมื่อใช้ฟังก์ชัน TREND และ GROWTH จะไม่ทราบสมการของเส้นแนวโน้ม ควรสังเกตว่าผู้เขียนไม่ได้กำหนดที่จะนำเสนอหลักสูตรการวิเคราะห์การถดถอยด้วยความสมบูรณ์ในระดับใด หน้าที่หลักคือการแสดงความสามารถของแพ็คเกจ Excel โดยใช้ตัวอย่างเฉพาะเมื่อแก้ไขปัญหาการประมาณ สาธิตเครื่องมือที่มีประสิทธิภาพที่ Excel มีในการสร้างการถดถอยและการคาดการณ์ แสดงให้เห็นว่าปัญหาดังกล่าวสามารถแก้ไขได้ค่อนข้างง่ายแม้โดยผู้ใช้ที่ไม่มีความรู้กว้างขวางเกี่ยวกับการวิเคราะห์การถดถอย ตัวอย่างการแก้ปัญหาเฉพาะ มาดูการแก้ปัญหาเฉพาะโดยใช้เครื่องมือ Excel ที่ระบุไว้ ปัญหาที่ 1 พร้อมตารางข้อมูลเกี่ยวกับผลกำไรขององค์กรขนส่งยานยนต์ปี 2538-2545 คุณต้องทำสิ่งต่อไปนี้: สร้างไดอะแกรม เพิ่มเส้นแนวโน้มเชิงเส้นและพหุนาม (กำลังสองและลูกบาศก์) ลงในแผนภูมิ ใช้สมการเส้นแนวโน้ม รับข้อมูลแบบตารางเกี่ยวกับผลกำไรขององค์กรสำหรับแต่ละเส้นแนวโน้มสำหรับปี 1995-2004 จัดทำการคาดการณ์ผลกำไรขององค์กรในปี 2546 และ 2547 การแก้ปัญหา ในช่วงของเซลล์ A4:C11 ของแผ่นงาน Excel ให้ป้อนแผ่นงานที่แสดงในรูปที่ 1 4. เมื่อเลือกช่วงของเซลล์ B4:C11 แล้ว เราจะสร้างไดอะแกรม เราเปิดใช้งานไดอะแกรมที่สร้างขึ้น และตามวิธีการที่อธิบายไว้ข้างต้น หลังจากเลือกประเภทของเส้นแนวโน้มในกล่องโต้ตอบเส้นแนวโน้ม (ดูรูปที่ 1) เราจะสลับกันเพิ่มเส้นแนวโน้มเชิงเส้น กำลังสอง และลูกบาศก์ลงในไดอะแกรม ในกล่องโต้ตอบเดียวกัน ให้เปิดแท็บพารามิเตอร์ (ดูรูปที่ 2) ในช่องชื่อของเส้นโค้งโดยประมาณ (เรียบ) ป้อนชื่อของแนวโน้มที่จะเพิ่ม และในฟิลด์การคาดการณ์ไปข้างหน้าสำหรับ: ระยะเวลา ให้ตั้งค่า มูลค่า 2 เนื่องจากมีแผนคาดการณ์กำไรล่วงหน้าอีก 2 ปี หากต้องการแสดงสมการถดถอยและค่าความน่าเชื่อถือของการประมาณ R2 ในพื้นที่ไดอะแกรม ให้เปิดใช้งานการแสดงสมการในช่องทำเครื่องหมายบนหน้าจอ และวางค่าความน่าเชื่อถือของการประมาณ (R^2) บนไดอะแกรม เพื่อการรับรู้ทางสายตาที่ดีขึ้น เราได้เปลี่ยนประเภท สี และความหนาของเส้นแนวโน้มที่สร้างขึ้น ซึ่งเราใช้แท็บมุมมองของกล่องโต้ตอบรูปแบบเส้นแนวโน้ม (ดูรูปที่ 3) แผนภาพผลลัพธ์ที่มีเส้นแนวโน้มเพิ่มจะแสดงในรูปที่ 1 5. เพื่อรับข้อมูลแบบตารางเกี่ยวกับผลกำไรขององค์กรสำหรับแต่ละเส้นแนวโน้มสำหรับปี 1995-2004 ลองใช้สมการเส้นแนวโน้มที่แสดงในรูปที่ 1 5. เมื่อต้องการทำเช่นนี้ ในเซลล์ในช่วง D3:F3 ให้ป้อนข้อมูลข้อความเกี่ยวกับประเภทของเส้นแนวโน้มที่เลือก: แนวโน้มเชิงเส้น แนวโน้มกำลังสอง แนวโน้มลูกบาศก์ จากนั้น ป้อนสูตรการถดถอยเชิงเส้นในเซลล์ D4 และใช้เครื่องหมายเติม คัดลอกสูตรนี้โดยมีการอ้างอิงสัมพันธ์กับช่วงเซลล์ D5:D13 ควรสังเกตว่าแต่ละเซลล์ที่มีสูตรการถดถอยเชิงเส้นจากช่วงของเซลล์ D4:D13 มีเซลล์ที่สอดคล้องกันจากช่วง A4:A13 เป็นอาร์กิวเมนต์ ในทำนองเดียวกัน สำหรับการถดถอยกำลังสอง ให้เติมช่วงของเซลล์ E4:E13 และสำหรับการถดถอยลูกบาศก์ ให้เติมช่วงของเซลล์ F4:F13 ดังนั้นจึงได้มีการรวบรวมการคาดการณ์กำไรขององค์กรในปี 2546 และ 2547 โดยใช้ 3 เทรนด์ ตารางค่าผลลัพธ์จะแสดงในรูป 6. ปัญหาที่ 2 สร้างไดอะแกรม เพิ่มเส้นแนวโน้มลอการิทึม กำลัง และเลขชี้กำลังลงในแผนภูมิ หาสมการของเส้นแนวโน้มที่ได้รับตลอดจนค่าความน่าเชื่อถือของการประมาณ R2 สำหรับแต่ละเส้น ใช้สมการเส้นแนวโน้ม รับข้อมูลแบบตารางเกี่ยวกับกำไรขององค์กรสำหรับแต่ละเส้นแนวโน้มสำหรับปี 1995-2002 คาดการณ์ผลกำไรของบริษัทในปี 2546 และ 2547 โดยใช้เส้นแนวโน้มเหล่านี้ การแก้ปัญหา ตามวิธีการที่ให้ไว้ในการแก้ปัญหา 1 เราได้ไดอะแกรมที่บวกลอการิทึม กำลัง และเส้นแนวโน้มเอ็กซ์โพเนนเชียลเข้าไป (รูปที่ 7) ต่อไป เมื่อใช้สมการเส้นแนวโน้มที่ได้รับ เราจะกรอกตารางค่าสำหรับกำไรขององค์กร รวมถึงค่าที่คาดการณ์ไว้สำหรับปี 2546 และ 2547 (รูปที่ 8) ในรูป 5 และรูปที่ จะเห็นได้ว่าแบบจำลองที่มีแนวโน้มลอการิทึมสอดคล้องกับค่าต่ำสุดของความน่าเชื่อถือในการประมาณ R2 = 0.8659 ค่าสูงสุดของ R2 สอดคล้องกับแบบจำลองที่มีแนวโน้มพหุนาม: กำลังสอง (R2 = 0.9263) และลูกบาศก์ (R2 = 0.933) ปัญหา 3 ด้วยตารางข้อมูลเกี่ยวกับผลกำไรขององค์กรขนส่งยานยนต์สำหรับปี 2538-2545 ที่ระบุในภารกิจที่ 1 คุณต้องทำตามขั้นตอนต่อไปนี้ รับชุดข้อมูลสำหรับเส้นแนวโน้มเชิงเส้นและเลขชี้กำลังโดยใช้ฟังก์ชัน TREND และ GROW ใช้ฟังก์ชัน TREND และ GROWTH ทำการคาดการณ์ผลกำไรขององค์กรในปี 2546 และ 2547 สร้างไดอะแกรมสำหรับข้อมูลต้นฉบับและชุดข้อมูลผลลัพธ์ การแก้ปัญหา ลองใช้แผ่นงานสำหรับปัญหาที่ 1 (ดูรูปที่ 4) เริ่มจากฟังก์ชัน TREND กันก่อน: เลือกช่วงของเซลล์ D4:D11 ซึ่งควรเต็มไปด้วยค่าของฟังก์ชัน TREND ที่สอดคล้องกับข้อมูลที่ทราบเกี่ยวกับผลกำไรขององค์กร เรียกคำสั่ง Function จากเมนู Insert ในกล่องโต้ตอบตัวช่วยสร้างฟังก์ชันที่ปรากฏขึ้น ให้เลือกฟังก์ชันแนวโน้มจากหมวดหมู่ทางสถิติ จากนั้นคลิกปุ่มตกลง การดำเนินการเดียวกันนี้สามารถทำได้โดยการคลิกปุ่ม (แทรกฟังก์ชัน) บนแถบเครื่องมือมาตรฐาน ในกล่องโต้ตอบอาร์กิวเมนต์ของฟังก์ชันที่ปรากฏขึ้น ให้ป้อนช่วงของเซลล์ C4:C11 ในช่อง Known_values_y ในช่อง Known_values_x - ช่วงของเซลล์ B4:B11; หากต้องการให้สูตรที่ป้อนกลายเป็นสูตรอาร์เรย์ ให้ใช้คีย์ผสม + + สูตรที่เราป้อนในแถบสูตรจะมีลักษณะดังนี้: =(TREND(C4:C11,B4:B11)) เป็นผลให้ช่วงของเซลล์ D4:D11 เต็มไปด้วยค่าที่สอดคล้องกันของฟังก์ชัน TREND (รูปที่ 9) เพื่อคาดการณ์ผลกำไรขององค์กรในปี 2546 และ 2547 จำเป็น: เลือกช่วงของเซลล์ D12:D13 ที่จะป้อนค่าที่คาดการณ์โดยฟังก์ชัน TREND เรียกใช้ฟังก์ชัน TREND และในกล่องโต้ตอบอาร์กิวเมนต์ของฟังก์ชันที่ปรากฏขึ้น ให้ป้อนในฟิลด์ Known_values_y - ช่วงของเซลล์ C4:C11; ในช่อง Known_values_x - ช่วงของเซลล์ B4:B11; และในช่อง New_values_x - ช่วงของเซลล์ B12:B13 เปลี่ยนสูตรนี้เป็นสูตรอาร์เรย์โดยใช้คีย์ผสม Ctrl + Shift + Enter สูตรที่ป้อนจะมีลักษณะดังนี้: =(TREND(C4:C11;B4:B11;B12:B13)) และช่วงของเซลล์ D12:D13 จะถูกเติมด้วยค่าที่ทำนายไว้ของฟังก์ชัน TREND (ดูรูปที่ 1) 9) ชุดข้อมูลจะถูกเติมในทำนองเดียวกันโดยใช้ฟังก์ชัน GROWTH ซึ่งใช้ในการวิเคราะห์การขึ้นต่อกันแบบไม่เชิงเส้น และทำงานในลักษณะเดียวกับ TREND ที่เป็นคู่เชิงเส้นทุกประการ รูปที่ 10 แสดงตารางในโหมดแสดงสูตร สำหรับข้อมูลเริ่มต้นและชุดข้อมูลที่ได้รับ แผนภาพแสดงในรูปที่ 1 สิบเอ็ด ปัญหาที่ 4 ด้วยตารางข้อมูลเกี่ยวกับการรับการสมัครใช้บริการโดยบริการจัดส่งขององค์กรขนส่งทางรถยนต์ในช่วงวันที่ 1 ถึงวันที่ 11 ของเดือนปัจจุบันคุณต้องดำเนินการดังต่อไปนี้ รับชุดข้อมูลสำหรับการถดถอยเชิงเส้น: การใช้ฟังก์ชัน SLOPE และ INTERCEPT โดยใช้ฟังก์ชัน LINEST รับชุดข้อมูลสำหรับการถดถอยเอ็กซ์โปเนนเชียลโดยใช้ฟังก์ชัน LGRFPRIBL ใช้ฟังก์ชันข้างต้น คาดการณ์เกี่ยวกับการรับใบสมัครไปยังบริการจัดส่งในช่วงวันที่ 12 ถึงวันที่ 14 ของเดือนปัจจุบัน สร้างไดอะแกรมสำหรับชุดข้อมูลต้นฉบับและข้อมูลที่ได้รับ การแก้ปัญหา โปรดทราบว่าต่างจากฟังก์ชัน TREND และ GROWTH ไม่มีฟังก์ชันใดในรายการข้างต้น (SLOPE, INTERCEPT, LINEST, LGRFPRIB) เป็นการถดถอย ฟังก์ชันเหล่านี้มีบทบาทสนับสนุนเท่านั้น โดยกำหนดพารามิเตอร์การถดถอยที่จำเป็น สำหรับการถดถอยเชิงเส้นและเอ็กซ์โปเนนเชียลที่สร้างขึ้นโดยใช้ฟังก์ชัน SLOPE, INTERCEPT, LINEST, LGRFPRIB จะทราบลักษณะที่ปรากฏของสมการอยู่เสมอ ตรงกันข้ามกับการถดถอยเชิงเส้นและเอ็กซ์โพเนนเชียลที่สอดคล้องกับฟังก์ชัน TREND และ GROWTH 1
- มาสร้างการถดถอยเชิงเส้นด้วยสมการกัน: y = มx+ข โดยใช้ฟังก์ชัน SLOPE และ INTERCEPT โดยมีความชันการถดถอย m กำหนดโดยฟังก์ชัน SLOPE และเทอมอิสระ b โดยฟังก์ชัน INTERCEPT ในการดำเนินการนี้ เราดำเนินการดังต่อไปนี้: ป้อนตารางต้นฉบับลงในช่วงเซลล์ A4:B14; ค่าของพารามิเตอร์ m จะถูกกำหนดในเซลล์ C19 เลือกฟังก์ชันความชันจากหมวดสถิติ ป้อนช่วงของเซลล์ B4:B14 ในช่องknown_values_y และช่วงของเซลล์ A4:A14 ในช่องknown_values_x สูตรจะถูกป้อนในเซลล์ C19: =SLOPE(B4:B14,A4:A14); เมื่อใช้เทคนิคที่คล้ายกัน จะกำหนดค่าของพารามิเตอร์ b ในเซลล์ D19 และเนื้อหาจะมีลักษณะดังนี้: =SEGMENT(B4:B14,A4:A14) ดังนั้นค่าของพารามิเตอร์ m และ b ที่จำเป็นสำหรับการสร้างการถดถอยเชิงเส้นจะถูกเก็บไว้ในเซลล์ C19, D19 ตามลำดับ จากนั้น ป้อนสูตรการถดถอยเชิงเส้นในเซลล์ C4 ในรูปแบบ: =$C*A4+$D ในสูตรนี้ เซลล์ C19 และ D19 จะถูกเขียนด้วยการอ้างอิงแบบสัมบูรณ์ (ที่อยู่ของเซลล์ไม่ควรเปลี่ยนแปลงในระหว่างการคัดลอกที่เป็นไปได้) เครื่องหมายอ้างอิงสัมบูรณ์ $ สามารถพิมพ์ได้จากแป้นพิมพ์หรือใช้ปุ่ม F4 หลังจากวางเคอร์เซอร์บนที่อยู่ของเซลล์แล้ว ใช้จุดจับเติม คัดลอกสูตรนี้ลงในช่วงของเซลล์ C4:C17 เราได้รับชุดข้อมูลที่ต้องการ (รูปที่ 12) เนื่องจากจำนวนคำขอเป็นจำนวนเต็ม คุณควรตั้งค่ารูปแบบตัวเลขด้วยจำนวนตำแหน่งทศนิยมเป็น 0 บนแท็บตัวเลขของหน้าต่างรูปแบบเซลล์ 2
- ทีนี้มาสร้างการถดถอยเชิงเส้นที่กำหนดโดยสมการ: y = มx+ข โดยใช้ฟังก์ชัน LINEST สำหรับสิ่งนี้: ป้อนฟังก์ชัน LINEST เป็นสูตรอาร์เรย์ในช่วงเซลล์ C20:D20: =(LINEST(B4:B14,A4:A14)) เป็นผลให้เราได้รับค่าพารามิเตอร์ m ในเซลล์ C20 และค่าพารามิเตอร์ b ในเซลล์ D20 ป้อนสูตรในเซลล์ D4: =$C*A4+$D; คัดลอกสูตรนี้โดยใช้เครื่องหมายเติมลงในช่วงเซลล์ D4:D17 และรับชุดข้อมูลที่ต้องการ 3
- เราสร้างการถดถอยเอ็กซ์โปเนนเชียลด้วยสมการ: การใช้ฟังก์ชัน LGRFPRIBL จะดำเนินการในลักษณะเดียวกัน: ในช่วงเซลล์ C21:D21 เราป้อนฟังก์ชัน LGRFPRIBL เป็นสูตรอาร์เรย์: =( LGRFPRIBL (B4:B14,A4:A14)) ในกรณีนี้ ค่าของพารามิเตอร์ m จะถูกกำหนดในเซลล์ C21 และค่าของพารามิเตอร์ b จะถูกกำหนดในเซลล์ D21 ใส่สูตรลงในเซลล์ E4: =$D*$C^A4; โดยใช้เครื่องหมายเติม สูตรนี้จะถูกคัดลอกไปยังช่วงของเซลล์ E4:E17 โดยที่ชุดข้อมูลสำหรับการถดถอยเอ็กซ์โปเนนเชียลจะอยู่ (ดูรูปที่ 12) ในรูป รูปที่ 13 แสดงตารางที่คุณสามารถดูฟังก์ชันที่เราใช้กับช่วงเซลล์ที่ต้องการ รวมถึงสูตรต่างๆ ขนาด ร
2
เรียกว่า ค่าสัมประสิทธิ์การตัดสินใจ. ภารกิจในการสร้างการพึ่งพาการถดถอยคือการหาเวกเตอร์ของสัมประสิทธิ์ m ของแบบจำลอง (1) ซึ่งสัมประสิทธิ์ R รับค่าสูงสุด เพื่อประเมินความสำคัญของ R จะใช้การทดสอบ F ของฟิชเชอร์ โดยคำนวณโดยใช้สูตร ที่ไหน n- ขนาดตัวอย่าง (จำนวนการทดลอง) k คือจำนวนสัมประสิทธิ์แบบจำลอง ถ้า F เกินค่าวิกฤตของข้อมูล nและ เคและความน่าจะเป็นของความเชื่อมั่นที่ยอมรับได้ จึงถือว่าค่า R มีนัยสำคัญ ตารางค่าวิกฤตของ F แสดงไว้ในหนังสืออ้างอิงเกี่ยวกับสถิติทางคณิตศาสตร์ ดังนั้นความสำคัญของ R ไม่เพียงแต่ถูกกำหนดโดยค่าของมันเท่านั้น แต่ยังรวมถึงอัตราส่วนระหว่างจำนวนการทดลองและจำนวนสัมประสิทธิ์ (พารามิเตอร์) ของแบบจำลองด้วย อันที่จริง อัตราส่วนสหสัมพันธ์สำหรับ n=2 สำหรับแบบจำลองเชิงเส้นอย่างง่ายเท่ากับ 1 (เส้นตรงเส้นเดียวสามารถลากผ่าน 2 จุดบนระนาบได้เสมอ) อย่างไรก็ตาม หากข้อมูลการทดลองเป็นตัวแปรสุ่ม ควรเชื่อถือค่า R ดังกล่าวด้วยความระมัดระวังอย่างยิ่ง โดยปกติแล้ว เพื่อให้ได้ R ที่มีนัยสำคัญและการถดถอยที่เชื่อถือได้ พวกเขาพยายามให้แน่ใจว่าจำนวนการทดลองเกินจำนวนสัมประสิทธิ์แบบจำลอง (n>k) อย่างมีนัยสำคัญ ในการสร้างแบบจำลองการถดถอยเชิงเส้น คุณต้องมี: 1) เตรียมรายการ n แถวและ m คอลัมน์ที่มีข้อมูลการทดลอง (คอลัมน์ที่มีค่าเอาต์พุต ยจะต้องเป็นรายการแรกหรือรายการสุดท้าย) ตัวอย่างเช่น ลองนำข้อมูลจากงานก่อนหน้าโดยเพิ่มคอลัมน์ชื่อ “หมายเลขงวด” กำหนดหมายเลขงวดตั้งแต่ 1 ถึง 12 (ซึ่งจะเป็นค่าเหล่านี้ เอ็กซ์) 2) ไปที่เมนู ข้อมูล/การวิเคราะห์ข้อมูล/การถดถอย หากรายการ "การวิเคราะห์ข้อมูล" ในเมนู "เครื่องมือ" หายไป คุณควรไปที่รายการ "ส่วนเสริม" ในเมนูเดียวกันและทำเครื่องหมายในช่อง "แพ็คเกจการวิเคราะห์" 3) ในกล่องโต้ตอบ "การถดถอย" ให้ตั้งค่า: · ช่วงเวลาอินพุต Y; · ช่วงเวลาอินพุต X; · ช่วงเอาท์พุต - เซลล์ด้านซ้ายบนของช่วงเวลาที่ผลการคำนวณจะถูกวาง (แนะนำให้วางไว้บนแผ่นงานใหม่) 4) คลิก "ตกลง" และวิเคราะห์ผลลัพธ์ การประมาณข้อมูลการทดลองเป็นวิธีการที่ใช้การแทนที่ข้อมูลที่ได้รับจากการทดลองด้วยฟังก์ชันการวิเคราะห์ที่ใกล้เคียงที่สุดหรือเกิดขึ้นพร้อมกันที่จุดสำคัญด้วยค่าดั้งเดิม (ข้อมูลที่ได้รับระหว่างการทดลองหรือการทดลอง) ปัจจุบัน มีสองวิธีในการกำหนดฟังก์ชันการวิเคราะห์: โดยการสร้างพหุนามการประมาณค่า n องศาที่ผ่านไป โดยตรงผ่านทุกจุดอาร์เรย์ข้อมูลที่กำหนด ในกรณีนี้ ฟังก์ชันการประมาณจะแสดงในรูปแบบของ: พหุนามการประมาณค่าในรูปแบบลากรองจ์ หรือพหุนามการประมาณค่าในรูปแบบนิวตัน โดยการสร้างพหุนามประมาณ n องศาที่ผ่านไป ใกล้กับจุดต่างๆ มากที่สุดจากอาร์เรย์ข้อมูลที่กำหนดให้ ดังนั้นฟังก์ชันการประมาณจึงทำให้สัญญาณรบกวนแบบสุ่ม (หรือข้อผิดพลาด) ที่อาจเกิดขึ้นระหว่างการทดลองราบรื่นขึ้น โดยค่าที่วัดได้ระหว่างการทดลองขึ้นอยู่กับปัจจัยสุ่มที่ผันผวนตามกฎการสุ่มของตัวเอง (ข้อผิดพลาดในการวัดหรือเครื่องมือ ความไม่ถูกต้องหรือการทดลอง) ข้อผิดพลาด) ในกรณีนี้ ฟังก์ชันการประมาณจะถูกกำหนดโดยใช้วิธีกำลังสองน้อยที่สุด วิธีกำลังสองน้อยที่สุด(ในวรรณคดีภาษาอังกฤษ Ordinary Least Squares, OLS) เป็นวิธีทางคณิตศาสตร์ที่มีพื้นฐานอยู่บนการหาฟังก์ชันการประมาณ ซึ่งสร้างขึ้นในบริเวณที่ใกล้กับจุดมากที่สุดจากอาร์เรย์ข้อมูลการทดลองที่กำหนด ความใกล้เคียงของฟังก์ชันดั้งเดิมและฟังก์ชันการประมาณ F(x) ถูกกำหนดโดยการวัดเชิงตัวเลข กล่าวคือ ผลรวมของการเบี่ยงเบนกำลังสองของข้อมูลการทดลองจากเส้นโค้งโดยประมาณ F(x) ควรมีค่าน้อยที่สุด เส้นโค้งโดยประมาณที่สร้างขึ้นโดยใช้วิธีกำลังสองน้อยที่สุด ใช้วิธีการกำลังสองน้อยที่สุด: เพื่อแก้ระบบสมการที่กำหนดเกินกำหนดเมื่อจำนวนสมการเกินจำนวนที่ไม่ทราบ เพื่อค้นหาคำตอบในกรณีของระบบสมการไม่เชิงเส้นธรรมดา (ไม่ได้กำหนดไว้เกินกำหนด) เพื่อประมาณค่าจุดด้วยฟังก์ชันการประมาณค่าบางอย่าง ฟังก์ชันการประมาณโดยใช้วิธีกำลังสองน้อยที่สุดถูกกำหนดจากเงื่อนไขของผลรวมขั้นต่ำของการเบี่ยงเบนกำลังสองของฟังก์ชันการประมาณที่คำนวณจากอาร์เรย์ข้อมูลการทดลองที่กำหนด เกณฑ์ของวิธีกำลังสองน้อยที่สุดนี้เขียนเป็นนิพจน์ต่อไปนี้: ค่าของฟังก์ชันการประมาณที่คำนวณได้ที่จุดปม อาร์เรย์ข้อมูลการทดลองที่กำหนดที่จุดสำคัญ เกณฑ์กำลังสองมีคุณสมบัติ "ดี" หลายประการ เช่น ความสามารถในการหาอนุพันธ์และให้วิธีแก้ปัญหาเฉพาะสำหรับปัญหาการประมาณด้วยฟังก์ชันการประมาณพหุนาม ฟังก์ชันการประมาณจะเป็นพหุนามของดีกรี m ขึ้นอยู่กับเงื่อนไขของปัญหา ระดับของฟังก์ชันการประมาณไม่ได้ขึ้นอยู่กับจำนวนจุดปม แต่ขนาดของมันจะต้องน้อยกว่าขนาด (จำนวนจุด) ของอาร์เรย์ข้อมูลการทดลองที่กำหนดเสมอ ∙ หากระดับของฟังก์ชันการประมาณคือ m=1 เราจะประมาณฟังก์ชันแบบตารางด้วยเส้นตรง (การถดถอยเชิงเส้น) ∙ หากระดับของฟังก์ชันการประมาณคือ m=2 เราจะประมาณฟังก์ชันตารางด้วยพาราโบลากำลังสอง (การประมาณกำลังสอง) ∙ หากระดับของฟังก์ชันการประมาณคือ m=3 เราจะประมาณฟังก์ชันตารางด้วยลูกบาศก์พาราโบลา (การประมาณลูกบาศก์) ในกรณีทั่วไป เมื่อจำเป็นต้องสร้างพหุนามโดยประมาณขององศา m สำหรับค่าตารางที่กำหนด เงื่อนไขสำหรับผลรวมขั้นต่ำของค่าเบี่ยงเบนกำลังสองเหนือจุดปมทั้งหมดจะถูกเขียนใหม่ในรูปแบบต่อไปนี้: - ค่าสัมประสิทธิ์ที่ไม่รู้จักของพหุนามโดยประมาณของระดับ m จำนวนค่าตารางที่ระบุ เงื่อนไขที่จำเป็นสำหรับการมีอยู่ของฟังก์ชันขั้นต่ำคือการเท่ากับศูนย์ของอนุพันธ์ย่อยบางส่วนเทียบกับตัวแปรที่ไม่รู้จัก - เป็นผลให้เราได้รับระบบสมการดังต่อไปนี้: มาแปลงระบบสมการเชิงเส้นที่ได้: เปิดวงเล็บแล้วย้ายพจน์อิสระไปทางด้านขวาของนิพจน์ เป็นผลให้ระบบผลลัพธ์ของนิพจน์พีชคณิตเชิงเส้นจะถูกเขียนในรูปแบบต่อไปนี้: ระบบนิพจน์พีชคณิตเชิงเส้นนี้สามารถเขียนใหม่ได้ในรูปแบบเมทริกซ์: เป็นผลให้ได้ระบบสมการเชิงเส้นขนาด m+1 ซึ่งประกอบด้วยค่าไม่ทราบค่า m+1 ระบบนี้สามารถแก้ไขได้โดยใช้วิธีใดก็ได้ในการแก้สมการพีชคณิตเชิงเส้น (เช่น วิธีเกาส์เซียน) จากผลของการแก้ปัญหา จะพบพารามิเตอร์ที่ไม่รู้จักของฟังก์ชันการประมาณซึ่งให้ผลรวมขั้นต่ำของการเบี่ยงเบนกำลังสองของฟังก์ชันการประมาณจากข้อมูลต้นฉบับ เช่น การประมาณกำลังสองที่ดีที่สุดที่เป็นไปได้ ควรจำไว้ว่าหากข้อมูลต้นฉบับเปลี่ยนค่าสัมประสิทธิ์ทั้งหมดจะเปลี่ยนค่า เนื่องจากข้อมูลต้นฉบับจะถูกกำหนดโดยสมบูรณ์ การประมาณแหล่งข้อมูลโดยการพึ่งพาเชิงเส้น (การถดถอยเชิงเส้น) เป็นตัวอย่าง ลองพิจารณาเทคนิคในการกำหนดฟังก์ชันการประมาณ ซึ่งระบุไว้ในรูปแบบของการพึ่งพาเชิงเส้น ตามวิธีกำลังสองน้อยที่สุด เงื่อนไขสำหรับผลรวมขั้นต่ำของส่วนเบี่ยงเบนกำลังสองเขียนไว้ในรูปแบบต่อไปนี้: พิกัดของโหนดตาราง ค่าสัมประสิทธิ์ที่ไม่รู้จักของฟังก์ชันการประมาณ ซึ่งระบุเป็นการพึ่งพาเชิงเส้น เงื่อนไขที่จำเป็นสำหรับการมีอยู่ของฟังก์ชันขั้นต่ำคือความเสมอภาคกับศูนย์ของอนุพันธ์ย่อยของฟังก์ชันด้วยความเคารพต่อตัวแปรที่ไม่รู้จัก เป็นผลให้เราได้รับระบบสมการดังต่อไปนี้: ให้เราแปลงระบบสมการเชิงเส้นผลลัพธ์ เราแก้ระบบผลลัพธ์ของสมการเชิงเส้น ค่าสัมประสิทธิ์ของฟังก์ชันการประมาณในรูปแบบการวิเคราะห์ถูกกำหนดดังนี้ (วิธีของแครเมอร์): ค่าสัมประสิทธิ์เหล่านี้ช่วยให้มั่นใจได้ถึงการสร้างฟังก์ชันการประมาณเชิงเส้นตามเกณฑ์ในการลดผลรวมของกำลังสองของฟังก์ชันการประมาณจากค่าตารางที่กำหนด (ข้อมูลการทดลอง) อัลกอริทึมสำหรับการนำวิธีกำลังสองน้อยที่สุดไปใช้ 1. ข้อมูลเริ่มต้น: มีการระบุอาร์เรย์ของข้อมูลการทดลองที่มีจำนวนการวัด N มีการระบุระดับของพหุนามโดยประมาณ (m) 2. อัลกอริธึมการคำนวณ: 2.1. ค่าสัมประสิทธิ์ถูกกำหนดไว้สำหรับการสร้างระบบสมการที่มีมิติ ค่าสัมประสิทธิ์ของระบบสมการ (ด้านซ้ายของสมการ) - ดัชนีจำนวนคอลัมน์ของเมทริกซ์จตุรัสของระบบสมการ เงื่อนไขอิสระของระบบสมการเชิงเส้น (ด้านขวาของสมการ) - ดัชนีหมายเลขแถวของเมทริกซ์จตุรัสของระบบสมการ 2.2. การสร้างระบบสมการเชิงเส้นที่มีมิติ 2.3. การแก้ระบบสมการเชิงเส้นเพื่อกำหนดค่าสัมประสิทธิ์ที่ไม่รู้จักของพหุนามประมาณระดับ m 2.4 การหาผลรวมของการเบี่ยงเบนกำลังสองของพหุนามโดยประมาณจากค่าดั้งเดิมที่จุดปมทั้งหมด ค่าที่พบของผลรวมของการเบี่ยงเบนกำลังสองคือค่าต่ำสุดที่เป็นไปได้ การประมาณโดยใช้ฟังก์ชันอื่น ควรสังเกตว่าเมื่อประมาณข้อมูลต้นฉบับตามวิธีกำลังสองน้อยที่สุด บางครั้งฟังก์ชันลอการิทึม ฟังก์ชันเอ็กซ์โปเนนเชียล และกำลังก็ถูกใช้เป็นฟังก์ชันการประมาณ การประมาณลอการิทึม ลองพิจารณากรณีที่ฟังก์ชันการประมาณถูกกำหนดโดยฟังก์ชันลอการิทึมของแบบฟอร์ม:ตัวอย่างจากชีวิต
ฉันจงใจไม่ทำให้เลียผลลัพธ์เพราะ... ฉันแค่อยากจะแสดงให้เห็นว่าคุณสามารถใช้วิธีกำลังสองน้อยที่สุดได้อย่างไร นี่คือรหัสการฝึกอบรม ตอนนี้ให้ฉันยกตัวอย่างจากชีวิต:
– มูลค่าการซื้อขายประจำปีของร้านขายของชำ, ล้านรูเบิล.
สำหรับร้านขายของชำ ฉันคิดว่าทุกอย่างชัดเจน: - นี่คือพื้นที่ของร้านที่ 1 - มูลค่าการซื้อขายประจำปี - พื้นที่ของร้านที่ 2 - มูลค่าการซื้อขายประจำปี ฯลฯ อย่างไรก็ตาม การเข้าถึงสื่อลับนั้นไม่จำเป็นเลย - การประเมินมูลค่าการค้าที่แม่นยำอย่างเป็นธรรมสามารถทำได้โดยใช้ สถิติทางคณิตศาสตร์- อย่างไรก็ตาม อย่าเพิ่งวอกแวก หลักสูตรจารกรรมเชิงพาณิชย์ได้รับค่าตอบแทนแล้ว =)
จะประเมินความแม่นยำของการประมาณนี้ได้อย่างไร? ให้เราคำนวณความแตกต่าง (ส่วนเบี่ยงเบน) ระหว่างค่าการทดลองและค่าฟังก์ชันด้วย (เราศึกษาการวาดภาพ)- ความคิดแรกที่เข้ามาในใจคือการประมาณว่าผลรวมจะมีขนาดใหญ่เพียงใด แต่ปัญหาคือความแตกต่างอาจเป็นลบได้ (ตัวอย่างเช่น, )
และการเบี่ยงเบนอันเป็นผลจากผลรวมดังกล่าวจะหักล้างกัน ดังนั้นในการประมาณความแม่นยำของการประมาณจึงขอผลรวม โมดูลการเบี่ยงเบน:
หลังจากนั้นอัลกอริทึมในการแก้ปัญหาของเราก็เริ่มปรากฏ:
ใช้วิธีกำลังสองน้อยที่สุด หาฟังก์ชันเชิงเส้นที่ประมาณค่าเชิงประจักษ์ได้ดีที่สุด (มีประสบการณ์)ข้อมูล. เขียนแบบเพื่อสร้างจุดทดลองและกราฟของฟังก์ชันการประมาณในระบบพิกัดสี่เหลี่ยมคาร์ทีเซียน - ค้นหาผลรวมของการเบี่ยงเบนกำลังสองระหว่างค่าเชิงประจักษ์และค่าทางทฤษฎี ค้นหาว่าคุณสมบัติจะดีกว่านี้หรือไม่ (จากมุมมองของวิธีกำลังสองน้อยที่สุด)นำจุดทดลองเข้ามาใกล้ยิ่งขึ้น
การคำนวณสามารถทำได้ด้วยไมโครเครื่องคิดเลข แต่จะดีกว่าถ้าใช้ Excel ทั้งเร็วกว่าและไม่มีข้อผิดพลาด ดูวิดีโอสั้น ๆ:
ซึ่งหมายความว่าระบบมีวิธีแก้ปัญหาเฉพาะตัว
จะได้ทางด้านขวาของสมการที่เกี่ยวข้อง ซึ่งหมายความว่าระบบได้รับการแก้ไขอย่างถูกต้อง
เส้นตรงที่สร้างขึ้นเรียกว่า เส้นแนวโน้ม
(กล่าวคือ เส้นแนวโน้มเชิงเส้น กล่าวคือ ในกรณีทั่วไป แนวโน้มไม่จำเป็นต้องเป็นเส้นตรง)- ใครๆ ก็คุ้นเคยกับสำนวนที่ว่า "กำลังอินเทรนด์" และฉันคิดว่าคำนี้ไม่ต้องการความคิดเห็นเพิ่มเติม
อีกครั้ง สามารถทำได้ด้วยตนเอง ในกรณีนี้ ฉันจะยกตัวอย่างสำหรับประเด็นที่ 1:
แต่จะมีประสิทธิภาพมากกว่ามากหากทำด้วยวิธีที่ทราบอยู่แล้ว:
และอีกครั้ง ในกรณีนี้ การคำนวณสำหรับจุดที่ 1:
ใน Excel เราใช้ฟังก์ชันมาตรฐาน ประสบการณ์ (ไวยากรณ์สามารถพบได้ในวิธีใช้ Excel).
การวิเคราะห์การถดถอยเป็นที่มาของสมการการถดถอย โดยใช้ค่าเฉลี่ยของตัวแปรสุ่ม (คุณลักษณะผลลัพธ์) ซึ่งสามารถหาได้หากทราบค่าของตัวแปรอื่น (หรืออื่นๆ) (คุณลักษณะปัจจัย) ประกอบด้วยขั้นตอนต่อไปนี้:
ส่วนใหญ่แล้ว รูปแบบเชิงเส้นจะใช้เพื่ออธิบายความสัมพันธ์ทางสถิติของคุณลักษณะต่างๆ การมุ่งเน้นไปที่ความสัมพันธ์เชิงเส้นอธิบายได้จากการตีความพารามิเตอร์ทางเศรษฐศาสตร์ที่ชัดเจน การแปรผันของตัวแปรที่จำกัด และความจริงที่ว่าในกรณีส่วนใหญ่ของความสัมพันธ์แบบไม่เชิงเส้นจะถูกแปลง (โดยลอการิทึมหรือการแทนที่ตัวแปร) ให้เป็นรูปแบบเชิงเส้นเพื่อทำการคำนวณ .
ในกรณีของความสัมพันธ์เชิงเส้นตรงแบบคู่ สมการการถดถอยจะอยู่ในรูปแบบ: y i =a+b·x i +u i พารามิเตอร์ a และ b ของสมการนี้ประมาณจากข้อมูลการสังเกตทางสถิติ x และ y ผลลัพธ์ของการประเมินดังกล่าวคือสมการ โดยที่ คือค่าประมาณของพารามิเตอร์ a และ b คือค่าของคุณลักษณะผลลัพธ์ (ตัวแปร) ที่ได้รับจากสมการการถดถอย (ค่าที่คำนวณได้)
วิธีกำลังสองน้อยที่สุดให้ค่าประมาณพารามิเตอร์ของสมการถดถอยที่ดีที่สุด (สม่ำเสมอ มีประสิทธิภาพ และไม่เอนเอียง) แต่เฉพาะในกรณีที่เป็นไปตามสมมติฐานบางประการเกี่ยวกับเทอมสุ่ม (u) และตัวแปรอิสระ (x) เท่านั้น (ดูสมมติฐาน OLS)
อย่างเป็นทางการ การทดสอบโอแอลเอสสามารถเขียนได้ดังนี้: .การจำแนกวิธีกำลังสองน้อยที่สุด
สัญกรณ์ทางคณิตศาสตร์สำหรับปัญหานี้: .
เราทราบค่าของ y i และ x i =1...n ซึ่งเป็นข้อมูลเชิงสังเกต ในฟังก์ชัน S พวกมันแทนค่าคงที่ ตัวแปรในฟังก์ชันนี้เป็นค่าประมาณที่จำเป็นของพารามิเตอร์ - , ในการค้นหาฟังก์ชันขั้นต่ำของตัวแปรสองตัว จำเป็นต้องคำนวณอนุพันธ์ย่อยของฟังก์ชันนี้สำหรับแต่ละพารามิเตอร์และจัดให้เป็นศูนย์ เช่น .
เป็นผลให้เราได้ระบบสมการเชิงเส้นปกติ 2 แบบ:
ในการแก้ปัญหาระบบนี้ เราจะพบการประมาณค่าพารามิเตอร์ที่ต้องการ:
ความถูกต้องของการคำนวณพารามิเตอร์ของสมการถดถอยสามารถตรวจสอบได้โดยการเปรียบเทียบจำนวน (อาจมีความคลาดเคลื่อนบางประการเนื่องจากการปัดเศษการคำนวณ)
ในการคำนวณค่าประมาณพารามิเตอร์ คุณสามารถสร้างตารางที่ 1 ได้
เครื่องหมายของสัมประสิทธิ์การถดถอย b บ่งบอกถึงทิศทางของความสัมพันธ์ (ถ้า b >0 ความสัมพันธ์จะเป็นทางตรง ถ้า b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
อย่างเป็นทางการ ค่าของพารามิเตอร์ a คือค่าเฉลี่ยของ y โดยที่ x เท่ากับศูนย์ หากแอตทริบิวต์-ปัจจัยไม่มีและไม่สามารถมีค่าเป็นศูนย์ได้ การตีความพารามิเตอร์ a ข้างต้นก็ไม่สมเหตุสมผล
ช่วงของค่าที่ยอมรับได้ของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคือตั้งแต่ –1 ถึง +1 สัญลักษณ์ของค่าสัมประสิทธิ์สหสัมพันธ์บ่งบอกถึงทิศทางของความสัมพันธ์ ถ้า r x, y >0 แสดงว่าการเชื่อมต่อเป็นแบบตรง ถ้า r x, y<0, то связь обратная.
หากสัมประสิทธิ์นี้ใกล้เคียงกับความสามัคคีในขนาด ความสัมพันธ์ระหว่างคุณลักษณะต่างๆ ก็สามารถตีความได้ว่าเป็นความสัมพันธ์เชิงเส้นที่ค่อนข้างใกล้เคียงกัน หากโมดูลมีค่าเท่ากับหนึ่ง ê r x , y ê =1 ความสัมพันธ์ระหว่างคุณลักษณะต่างๆ จะเป็นเชิงเส้นตรงเชิงฟังก์ชัน หากจุดสนใจ x และ y มีความเป็นอิสระเชิงเส้น ดังนั้น r x,y จะใกล้เคียงกับ 0
ในการคำนวณ r x,y คุณสามารถใช้ตารางที่ 1 ได้เช่นกัน
,
โดยที่ d 2 คือความแปรปรวนของ y อธิบายโดยสมการถดถอย
e 2 - ความแปรปรวนของ y ที่เหลือ (ไม่ได้อธิบายโดยสมการถดถอย)
s 2 y - ผลต่างรวม (ทั้งหมด) ของ y
ค่าสัมประสิทธิ์การกำหนดลักษณะสัดส่วนของความแปรผัน (การกระจายตัว) ของคุณลักษณะผลลัพธ์ y อธิบายโดยการถดถอย (และด้วยเหตุนี้ ตัวประกอบ x) ในรูปแบบรวม (การกระจายตัว) y ค่าสัมประสิทธิ์การกำหนด R 2 yx ใช้ค่าตั้งแต่ 0 ถึง 1 ดังนั้นค่า 1-R 2 yx จะแสดงลักษณะของสัดส่วนของความแปรปรวน y ที่เกิดจากอิทธิพลของปัจจัยอื่น ๆ ที่ไม่ได้คำนึงถึงในแบบจำลองและข้อผิดพลาดของข้อกำหนด
ด้วยการถดถอยเชิงเส้นคู่ R 2 yx = r 2 yxสาระสำคัญของวิธีกำลังสองน้อยที่สุด (LSM)
สูตรการหาค่าสัมประสิทธิ์
การประมาณค่าความผิดพลาดของวิธีกำลังสองน้อยที่สุด
ภาพประกอบกราฟิกของวิธีกำลังสองน้อยที่สุด (LS)