ใช้ Excel เป็นเครื่องมือในการคัดลอกข้อมูลจากเว็บ

การ ขูดเว็บ(Web scraping)คือการดึงข้อมูล ข้อมูล หรือรูปภาพจากเว็บไซต์โดยใช้วิธีการอัตโนมัติ คิดว่า(Think)เป็นการคัดลอกและวาง(copy and paste)อัตโนมัติเต็มรูปแบบ

เราเขียนหรือใช้แอพเพื่อไปยังเว็บไซต์ที่เราต้องการและทำสำเนาของสิ่งที่เราต้องการจากเว็บไซต์เหล่านั้น มีความแม่นยำมากกว่าการดาวน์โหลดทั้งเว็บไซต์

เช่นเดียวกับเครื่องมืออื่นๆ การขูดเว็บสามารถใช้ได้ทั้งดีและชั่ว เหตุผลที่ดีกว่าบางประการในการคัดลอกเว็บไซต์คือการจัดอันดับเว็บไซต์ใน เครื่องมือค้นหาโดย(search engine)พิจารณาจากเนื้อหาการเปรียบเทียบราคาซื้อ(price comparison shopping)ของ หรือการตรวจสอบ ข้อมูลตลาดหุ้น (stock market information)คุณอาจจะใช้มันเป็นเครื่องมือในการวิจัย(research tool)ก็ได้

ฉันจะขูดเว็บไซต์ด้วยExcelได้อย่างไร

เชื่อหรือไม่ว่าExcelมีความสามารถในการดึงข้อมูลจากเว็บไซต์มาเป็นเวลานาน อย่างน้อย นับตั้งแต่Excel 2003 . เป็นเพียงการขูดเว็บเป็นสิ่งที่คนส่วนใหญ่ไม่ได้นึกถึง(t think)นับประสาเรื่องการใช้ โปรแกรมสเปรดชีต(spreadsheet program)เพื่อทำงาน แต่มันง่ายอย่างน่าประหลาดใจและทรงพลัง มาเรียนรู้วิธีการทำงานด้วยการสร้างคอลเลกชัน แป้นพิมพ์ ลัด ของ Microsoft Office(Microsoft Office keyboard)

ค้นหาไซต์ที่คุณต้องการขูด

สิ่งแรกที่เราจะทำคือค้นหาหน้าเว็บเฉพาะที่เราต้องการรับข้อมูล ไปที่ต้นทางแล้ว(source and search)ค้นหาที่https://support.office.com/เราจะใช้คำค้นหา(search term) "ทางลัดที่ใช้บ่อย" เราสามารถทำให้เฉพาะเจาะจงมากขึ้นโดยใช้ชื่อของแอปเฉพาะ เช่นOutlook , Excel , Wordเป็นต้น อาจเป็นความคิดที่ดีที่จะบุ๊กมาร์กหน้าผลลัพธ์เพื่อให้เราสามารถกลับไปที่นั่นได้อย่างง่ายดาย

คลิก(Click)ที่ผลการค้นหา(search result) "แป้นพิมพ์ลัดในExcelสำหรับ Windows" เมื่ออยู่ในหน้านั้น ให้ค้นหารายการเวอร์ชันของExcelแล้วคลิกเวอร์ชันที่ใหม่(Newer Versions)กว่า ตอนนี้เรากำลังทำงานกับสิ่งใหม่ล่าสุดและยิ่งใหญ่ที่สุด

เราสามารถกลับไปที่หน้าผลการค้นหาของเราและเปิดผลลัพธ์สำหรับแอป Office(Office apps) อื่นๆ ทั้งหมด ในแท็บของตนเองและบุ๊กมาร์กไว้ เป็นความคิดที่ดี แม้แต่สำหรับการออกกำลังกายนี้ นี่คือจุดที่คนส่วนใหญ่หยุดรวบรวม ทางลัดของ Officeแต่ไม่ใช่เรา เราจะใส่ไว้ในExcelเพื่อให้เราสามารถทำทุกอย่างที่เราต้องการกับพวกเขาได้ทุกเมื่อที่เราต้องการ

เปิด Excel และขูด

เปิดExcelและเริ่มเวิร์กบุ๊กใหม่ บันทึกเวิร์กบุ๊กเป็นOffice Shortcuts (Office Shortcuts)หากคุณมี OneDrive ให้บันทึกไว้ที่นั่นเพื่อให้ ฟีเจอร์ บันทึกอัตโนมัติ(AutoSave )ทำงาน

เมื่อบันทึกเวิร์กบุ๊กแล้ว ให้คลิกที่แท็บข้อมูล(Data)

ในแถบริบบิ้นของแท็บ Data(Data tab)ให้คลิกที่From Web(From Web)

หน้าต่าง ตัว ช่วยสร้าง จากเว็บ(From Web )จะเปิดขึ้น นี่คือที่ที่เราใส่ที่อยู่เว็บหรือ URL(web address or URL)ของเว็บไซต์ที่เราต้องการขูดข้อมูล สลับไปที่เว็บเบราว์เซอร์ของคุณและคัดลอก(copy) URL

วาง URL ลงในช่องURL ของวิซาร์ดจาก(From Web wizard)เว็บ เราสามารถเลือกใช้สิ่งนี้ในโหมดพื้นฐาน(Basic)หรือขั้นสูง (Advanced)โหมดขั้นสูง(Advanced mode)ทำให้เรามีตัวเลือกมากขึ้นในการเข้าถึงข้อมูลจากเว็บไซต์ สำหรับแบบฝึกหัดนี้ เราต้องใช้โหมดพื้นฐานเท่านั้น คลิก(Click) ตกลง(OK) _

Excelจะพยายามเชื่อมต่อกับเว็บไซต์ในขณะนี้ อาจใช้เวลาสักครู่ เราจะเห็นหน้าต่างความคืบหน้า(progress window)หากมี

หน้าต่าง ตัวนำทาง(Navigator) จะเปิดขึ้น และเราจะเห็นรายการตารางจากเว็บไซต์ทางด้านซ้าย เมื่อเราเลือกหนึ่งรายการ เราจะเห็นตัวอย่างตารางทางด้านขวา มาเลือกตารางทางลัดที่ใช้บ่อยกัน เถอะ(Frequently used shortcuts )

เราสามารถคลิกที่ แท็บ Web Viewเพื่อดูเว็บไซต์จริง หากเราต้องมองไปรอบๆ เพื่อหาตารางที่เราต้องการ เมื่อเราพบแล้ว เราสามารถคลิกที่มัน และมันจะถูกเลือกเพื่อนำเข้า

ตอนนี้เราคลิกที่ ปุ่ม โหลด(Load) ที่ด้านล่างของหน้าต่างนี้ มีตัวเลือกอื่นๆ ที่เราเลือกได้ ซึ่งซับซ้อนกว่าและอยู่นอกเหนือขอบเขตของการขูดครั้งแรก เพียงแค่ทราบว่าพวกเขาอยู่ที่นั่น ความสามารถในการขูดเว็บของ Excel นั้นทรงพลังมาก

ตารางเว็บ(web table)จะโหลดในExcelหลังจากไม่กี่วินาที เราจะเห็นข้อมูลทางด้านซ้าย โดยที่หมายเลข1อยู่ในภาพด้านล่าง หมายเลข2เน้นQuery ที่ ใช้ในการรับข้อมูลจากเว็บไซต์ เมื่อเรามีคำถามหลายรายการในสมุดงาน นี่คือที่ที่เราจะเลือกหนึ่งคำถามที่เราต้องใช้

สังเกต(Notice)ว่าข้อมูลเข้ามาในสเปรดชีตเป็นตาราง Excel ได้จัดเตรียมไว้ให้เราสามารถกรองหรือจัดเรียงข้อมูลได้

เราสามารถทำซ้ำขั้นตอนนี้สำหรับหน้าเว็บอื่นๆ ทั้งหมดที่มีปุ่มลัด ของ Office ที่เราต้องการสำหรับ (Office)Outlook , Word , Access , PowerPointและแอป Office(Office app) อื่น ๆ

การ รักษาข้อมูลที่ขูดให้เป็นปัจจุบัน(Scraped Data Current)ในExcel

เพื่อเป็นโบนัสสำหรับคุณ เราจะได้เรียนรู้วิธีทำให้ข้อมูลที่คัดลอกมาในExcelอยู่เสมอ นี่เป็นวิธีที่ยอดเยี่ยมในการแสดงให้เห็นว่า Excel(Excel)มีประสิทธิภาพเพียงใดในการดึงข้อมูล ถึงแม้ว่าเราจะทำเพียงแค่การขูดพื้นฐานที่สุดที่Excelสามารถทำได้

สำหรับตัวอย่างนี้ ให้ใช้หน้าเว็บข้อมูลหุ้น(stock information)เช่นhttps://www.cnbc.com/stocks/

ดูสิ่งที่เราทำก่อนหน้านี้แล้วคัดลอกและวาง(copy and paste)URLใหม่จากแถบที่(address bar)อยู่

คุณจะไปที่หน้าต่างตัวนำทาง(Navigator window)และดูตารางที่พร้อมใช้งาน มาเลือกดัชนีหุ้นสหรัฐรายใหญ่(Major U.S. Stock Indices)กัน

เมื่อข้อมูลถูกคัดลอกแล้ว เราจะเห็นสเปรดชีตต่อไปนี้

ทางด้านขวา เราจะเห็นข้อความค้นหาดัชนีหุ้นสหรัฐฯ ราย(Major U.S. Stock Indexes)ใหญ่ เลือก(Select)เพื่อให้ถูกเน้น ตรวจสอบ ให้(Make)แน่ใจว่าเราอยู่ใน แท็บ เครื่องมือตาราง(Table Tools)และใน พื้นที่ออกแบบ (Design)จากนั้นคลิกที่ลูกศร ลงใต้รีเฟรช (Refresh)จากนั้นคลิกที่คุณสมบัติการเชื่อม(Connection Properties)ต่อ

ในหน้าต่างคุณสมบัติการสืบค้น ภายใต้แท็บ (Query Properties )การใช้งาน(Usage) เราสามารถควบคุมวิธีการรีเฟรชข้อมูลนี้ได้ เราสามารถกำหนดช่วงเวลาเฉพาะเพื่อรีเฟรช หรือรีเฟรชเมื่อเราเปิดเวิร์กบุ๊กในครั้งต่อไป หรือรีเฟรชในพื้นหลัง หรือการรวมกันของสิ่งเหล่านี้ เมื่อเราเลือกสิ่งที่เราต้องการแล้ว ให้คลิกที่ตกลง(OK)เพื่อปิดหน้าต่างและดำเนินการต่อ

แค่นั้นแหละ! ตอนนี้คุณสามารถติดตามราคาหุ้น ผลการแข่งขันกีฬา หรือข้อมูลอื่นๆ ที่เปลี่ยนแปลงบ่อยจากสเปรดชีตExcel (Excel spreadsheet)ถ้าคุณใช้ สมการและฟังก์ชันของ Excel ได้ดี คุณจะทำเกือบทุกอย่างที่ต้องการกับข้อมูลได้

อาจพยายามระบุแนวโน้มหุ้น เรียกใช้กีฬาแฟนตาซีในที่ทำงาน หรืออาจเพียงแค่ติดตามสภาพอากาศ ใครจะรู้? จินตนาการและข้อมูลของคุณบนอินเทอร์เน็ต(Internet)เป็นข้อจำกัดเพียงอย่างเดียว



About the author

ฉันเป็นผู้เชี่ยวชาญ Windows 10 ที่ได้รับการแนะนำเป็นอย่างยิ่ง และฉันเชี่ยวชาญในการช่วยเหลือผู้คนในการปรับแต่งรูปลักษณ์ของคอมพิวเตอร์และทำให้เครื่องมือ Office ของพวกเขาใช้งานง่ายขึ้น ฉันใช้ทักษะของฉันเพื่อช่วยให้ผู้อื่นค้นพบวิธีที่มีประสิทธิภาพที่สุดในการทำงานกับ Microsoft Office รวมถึงวิธีจัดรูปแบบข้อความและกราฟิกสำหรับการพิมพ์ออนไลน์ วิธีสร้างธีมที่กำหนดเองสำหรับ Outlook และแม้กระทั่งวิธีปรับแต่งรูปลักษณ์ของแถบงานบนเดสก์ท็อป คอมพิวเตอร์.



Related posts