phanida33: ความรู้เกี่ยวกับ search engine

         ในโลกยุคอินเทอร์เน็ทในปัจจุบันนี้มีข้อมูลมากมายมหาศาล การที่จะค้นหาข้อมูลจำนวนมากมายอย่างนี้เราไม่อาจจะคลิกเพื่อค้นหาข้อมูลพบได้ง่ายๆ จำเป็นจะต้องอาศัยการค้นหาข้อมูลด้วยเครื่องมือค้นหาที่เรียกว่า Search Engine เข้ามาช่วยเพื่อความสะดวกและรวดเร็ว เว็บไซต์ที่ให้บริการค้นหาข้อมูลมีมากมายหลายที่ทั้งของคนไทยและต่างประเทศ ความหมาย/ประเภทของ Search Engine การค้นหาข้อมูลบนเครือข่ายอินเทอร์เน็ตที่มีอยู่เป็นจำนวนมาก ถ้าเราเปิดไปทีละหน้าจออาจจะต้องเสียเวลาในการค้นหา และอาจหาข้อมูลที่เราต้องการไม่พบ การที่เราจะค้นหาข้อมูลให้พบอย่างรวดเร็ว จะต้องใช้เว็บไซต์สำหรับการค้นหาข้อมูลที่เรียกว่า Search Engine Site ซึ่งจะทำหน้าที่รวบรวมรายชื่อเว็บไซต์ต่างๆ เอาไว้ โดยจัดแยกเป็นหมวดหมู่ ผู้ใช้งานเพียงแต่ทราบหัวข้อที่ต้องการค้นหาแล้วป้อน คำหรือข้อความของหัวข้อนั้นๆ ลงไปในช่องที่กำหนด Search Engine แต่ละแห่งมีวิธีการและการจัดเก็บฐานข้อมูลที่แตกต่างกันไปตามประเภทของ Search Engine ที่แต่ละเว็บไซต์นำมาใช้เก็บรวบรวมข้อมูล ดังนั้น การที่จะเข้าไปหาข้อมูลหรือเว็บไซต์ โดยวิธีการ Search นั้น อย่างน้อยจะต้องทราบว่า เว็บไซต์ที่เข้าไปใช้บริการ ใช้วิธีการหรือ ประเภทของ Search Engine อะไร เนื่องจากแต่ละประเภทมีความละเอียดในการจัดเก็บข้อมูลต่างกันไป การเลือกใช้เครื่องมือในการค้นหาจะต้องเข้าใจว่า ข้อมูลที่ต้องการค้นหานั้นมีลักษณะอย่างไร มีขอบข่ายกว้างขวางหรือแคบขนาดไหน แล้วจึงเลือกใช้เว็บไซต์ค้นหาที่ให้บริการตรงกับความต้องการของเรา
การค้นหาในรูปแบบ Search Engine
        การค้นหาในรูปแบบ Search Engine เป็นวิธีการอีกอย่างที่นิยมใช้การค้นหาข้อมูลคือการใช้ Search Engine ซึ่งผู้ใช้ส่วนใหญ่กว่า 70% จะใช้วิธีการค้นหาแบบนี้ หลักการทำงานของ Search Engine จะแตกต่างจากการใช้ Index จะมีลักษณะเป็นฐานข้อมูลขนาดใหญ่มหาศาล ที่กระจัดกระจายอยู่ทั่วไปบน Internet ไม่มีการแสดงข้อมูลออกมาเป็นลำดับขั้นของความสำคัญ การใช้งานจะเหมือนการสืบค้นฐานข้อมูลอื่นๆ คือ ต้องพิมพ์คำสำคัญ (Keyword) ซึ่งเป็นการอธิบายถึงข้อมูลที่ต้องการค้นหานั้นๆ เข้าไปจากนั้น Search Engine ก็จะแสดงข้อมูลและ WebSite ต่างๆที่เกี่ยวข้องออกมา
         Search Engine นั้นระบบฐานข้อมูลของจะได้รับการจัดสร้างโดยใช้ Software ที่มีหน้าที่เกี่ยวกับงานทางด้านนี้โดยเฉพาะมาเป็นตัวควบคุมและจัดการซึ่ง Software นี้ชื่อเรียกว่า Spider ซึ่งการทำงานจะใช้วิธีการเชื่อมโยงไปตามเครือข่ายต่างๆ ที่เชื่อมโยงถึงกันอยู่เต็มไปหมดใน Internet เพื่อค้นหา Website ที่เกิดขึ้นมาใหม่ๆ รวมทั้งยังสามารถตรวจสอบหาความเปลี่ยนแปลงของ ข้อมูลใน WebSite เดิมที่มีอยู่ ว่าที่ใดถูกอัพเดตแล้วบ้าง จากนั้นก็จะนำเอาข้อมูลทั้งหมดที่สำรวจเข้ามา ได้เก็บใส่เข้าไปในฐานข้อมูลของตนโดยอัตโนมัติ ยกตัวอย่างเช่น Excite, Lycos Infoserch เป็นต้น การค้นหาด้วยวิธี Search Engine นั้น มักจะได้ผลลัพธ์ออกมากว้างๆ ชี้เฉพาะเจาะจงได้ยาก บางครั้งข้อมูลที่ค้นหามาได้อาจมีถึงเป็นร้อยเป็นพัน WebSite

ความหมายของ Search Engine

Search Engine คือ เครื่องมือการค้นหาข้อมูลผ่านอินเตอร์เน็ต ที่ทุกคนสามารถหาข้อมูลผ่านอินเตอร์เน็ตก็ได้ โดยกรอกข้อมูลที่ต้องการค้นหา หรือ Keyword (คีย์เวิร์ด) เข้าไปที่ช่อง Search Box แล้วกด Enter ข้อมูลที่เราค้นหาก็จะถูกแสดงออกมาอย่างมากมาย เพื่อให้เราเลือกข้อมูลตรงกับความต้องการของเรามากที่สุด โดยลักษณะการแสดงผลของ Search Engine นั้นจะทำการแสดงผลแบบ เรียงอันดับ Search Results ผ่านหน้าจอคอมพิวเตอร์

ประเภทของ Search Engine

มี 3 ประเภท ดังนี้
1.) Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน โดยมีองค์ประกอบหลักเพียง 2 ส่วนด้วยกันคือ
1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือ เครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็กๆ ทำหน้าที่ในการตรวจหา และทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots เช่น http://www.google.com/

2.) Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้สามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมากๆ คล้าย ๆ กับสมุดหน้าเหลือง ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ตัวอย่างเช่น

1. ODP หรือ Dmoz ที่หลาย ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยด้วย (URL : http://www.dmoz.org )
2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย(URL : http://webindex.sanook.com )

3.) Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษาHTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเองและอีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร

จุดเด่นของการค้นหาด้วยวิธีการนี้ คือ สามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล แต่การค้นหาด้วยวิธีนี้มีจุดด้อย คือ วิธีการนี้จะไม่ให้ความสำคัญกับขนาดเล็กใหญ่ของตัวอักษร และมักจะผ่านเลยคำประเภท Natural Language (ภาษาพูด) ดังนั้น หากจะใช้ Search Engine แบบนี้ละก็ ขอให้ตระหนักถึงข้อบกพร่องเหล่านี้ด้วย

การใช้งาน Search Engine

มี 9 เทคนิค

เทคนิคที่ 1 การใช้คำสำคัญ (keyword) เพื่อเจาะจงเนื้อหา

1.) คำสำคัญที่เป็นภาษาไทยล้วนๆ

สมมติว่าคุณจะค้นหาข้อมูลเกี่ยวกับนักคณิตศาสตร์ คำสำคัญอันดับแรกที่เรานึกถึงได้ทันทีก็คือ นักคณิตศาสตร์ แต่ผมคิดว่าคำสำคัญเพียงคำเดียวก็ดูจะกว้างไป และในบางครั้งผลการค้นหาก็มากมายหลายสิบหน้า ถ้าเราจะเปิดอ่านทุกลิงก์ทุกหน้าก็คงไม่ดีแน่ ดังนั้นเราจึงต้องจำกัดผลการค้นหาให้แคบลงตามที่เราต้องการ สมมติว่าคุณต้องการข้อมูลเกี่ยวกับนักคณิตศาสตร์ชาวกรีก คำสำคัญที่ใช้ได้ก็ได้แก่ นักคณิตศาสตร์ และคำว่า กรีก คราวนี้สังเกตผลการค้นหาที่ได้ คุณจะพบว่าผลการค้นหามีจำนวนน้อยลง คราวนี้ก็สะดวกที่เราจะเลือกลิงก์ที่ต้องการได้ เช่นดังรูป

จากภาพประกอบ 1 ในกรอบรูปวงรี คุณจะเห็นได้ว่าผลการค้นหามีทั้งหมด 343 ผลลัพธ์ แต่เมื่อเพิ่มคำสำคัญเข้าไปอีกเพียงคำเดียวซึ่งก็คือคำว่า “กรีก” ในภาพประกอบ 2 ก็จะทำให้ผลการค้นหาลดลงเหลือเพียงผลลัพธ์เดียวเท่านั้น แต่ทั้งนี้จำนวนผลลัพธ์ที่ลดน้อยลงไม่อาจประกันได้ว่าเราจะได้ข้อมูลอย่างที่คาดหวังไว้

2.) คำสำคัญที่เป็นภาษาอังกฤษล้วนๆ

ในทำนองเดียวกัน ถ้าคุณอยากได้ข้อมูลเกี่ยวกับนักคณิตศาสตร์ชาวกรีกแต่เป็นภาษาอังกฤษ คำสำคัญ 2 คำแรกที่น่าจะใช้ได้ก็คือ greek mathematician แต่ผมมีข้อสังเกตของการใช้เว็บไซต์ http://www.google.co.th/ และ search engine หลายๆ ตัวในอินเทอร์เน็ต คือ ในการค้นหาข้อมูลที่ใช้คำสำคัญเป็นภาษาอังกฤษ (รวมทั้งภาษาไทยด้วย) ถ้าเราใช้เครื่องหมาย “ ” (double quote) คร่อมระหว่างคำสำคัญคู่ใดๆ ก็ตาม ผลการค้นหาอาจแตกต่างกันเล็กน้อยซึ่งเป็นรายละเอียดทางเทคนิค ผมจะไม่อธิบายไว้ในที่นี้ ในกรณีนี้คำสำคัญว่า greek mathematician (คำว่า greek แล้วเว้นวรรคจากนั้นตามด้วยคำว่า mathematician) อาจให้ผลการค้นหาที่ต่างจากคำสำคัญ “greek mathematician” และที่สำคัญอีกอย่างก็คือตัวอักษรใหญ่เล็กที่ต่างกันก็อาจจะให้ผลการค้นหาที่ต่างกันได้อีกเช่นกัน ดังรูป

จากภาพที่ 1 และภาพที่ 2 จะพบว่าเมื่อไม่ใช้เครื่องหมาย “ ” (double quote) คร่อมระหว่างคำสำคัญคู่ใดๆ ผลลัพธ์การค้นหามีจำนวนมากถึง 86,400 ผลลัพธ์ แต่เมื่อเราใส่เครื่องหมาย “ ” คร่อมระหว่างคำสำคัญคู่หนึ่งแล้ว ผลการค้นหาลดจำนวนลงเหลือเพียง 15,400 ผลลัพธ์ ซึ่งทำให้เราสะดวกต่อการค้นหาข้อมูลมากขึ้น และขอย้ำอีกครั้งหนึ่งว่า จำนวนผลลัพธ์ที่น้อยลงไม่ได้เป็นเครื่องรับประกันว่าเราจะได้ข้อมูลอย่างที่คาดหวังไว้แต่อย่างใด

3.) คำสำคัญที่มีทั้ง 2 ภาษาปนกัน

search engine บางแห่งอาจค้นไม่พบข้อมูลที่ต้องการเมื่อใช้คำสำคัญที่เป็นภาษาไทยกับภาษาอังกฤษปนกัน แต่อย่างไรก็ตามผมพบว่าเว็บไซต์ http://www.google.co.th ไม่มีปัญหากับคำสำคัญที่เป็นแบบ 2 ภาษาปนกัน สมมติว่าคุณต้องการไฟล์บทเรียนเกี่ยวกับไฟฟ้ากระแส คำสำคัญที่อาจจะใช้ได้มีดังต่อไปนี้ 1) ไฟฟ้ากระแสตรง “direct current”
2) “direct current” ไฟฟ้า กระแสตรง
3) “direct current” เนื้อหา (ดังรูป)

เทคนิคที่ 2 การใช้คำสำคัญ (keyword) เพื่อเจาะจงรูปแบบของไฟล์

ในการค้นหาข้อมูลนั้น บางครั้งเราอาจต้องการเจาะจงรูปแบบของไฟล์เพื่อวัตถุประสงค์บางอย่าง เช่น ต้องการนำไฟล์นั้นไปใช้พิมพ์ออกทางเครื่องพิมพ์ หรือว่านำไปใช้ประกอบการทำรายงาน หรือแม้กระทั่งนำไปใช้ในการนำเสนอผลงาน ซึ่ง search engine บางแห่งไม่สนับสนุนรูปแบบไฟล์อื่นๆ นอกจากไฟล์เว็บเพ็จที่มีนามสกุล (Extension) เป็น *.html หรือ *.htm แต่เว็บไซต์ http://www.google.co.th สนับสนุนไฟล์ในรูปแบบอื่นๆ นอกจาก *.html หรือ *.htm ได้แก่ *.doc (ไฟล์ที่สร้างจากโปรแกรม Microsoft Word), *.xls (ไฟล์ที่สร้างจากโปรแกรม Microsoft Excel), *.ppt (ไฟล์ที่สร้างจากโปรแกรม Microsoft PowerPoint) และไฟล์ *.pdf (Portable Document Format) ซึ่งเปิดอ่านได้จากโปรแกรมยอดนิยมอย่าง Adobe Acrobat Reader เป็นต้น

สมมติว่าคุณต้องการไฟล์บทเรียนเกี่ยวกับกรด – เบสที่อยู่ในรูปแบบไฟล์ pdf และไม่จำกัดภาษา คำสำคัญที่อาจจะใช้ได้มีดังต่อไปนี้
1) acid base pdf
2) “acid-base” pdf
3) “Aqueous Equillibria” lecture notes pdf
4) สมดุลกรด – เบส pdf
5) กรด – เบส pdf
6) กรด เบส pdf

เทคนิคที่ 3 หลีกเลี่ยงการใช้คำหรือเครื่องหมายบางประเภทประกอบในคำสำคัญ
search engine ส่วนใหญ่ซึ่งรวมถึง http://www.google.co.th มักจะไม่รวมเอาคำสรรพนามไม่ชี้เฉพาะ คำบุพบท คำสันธานในภาษาอังกฤษ เช่น a , an , the , on ฯลฯ เข้าไว้ในการค้นหา ถ้าหากว่าต้องการให้คำสรรพนามชี้เฉพาะ หรือคำยกเว้นต่างๆ รวมอยู่ในการค้นหาด้วย ผมแนะนำว่าให้ใช้เครื่องหมาย “ ” คร่อมคำเฉพาะนั้น

เทคนิคที่ 4 หลีกเลี่ยงการใช้คำสำคัญที่มีความยาวเกินไป

search engine ส่วนใหญ่ซึ่งรวมถึง http://www.google.co.th มักจะแสดงผลการค้นหาในทำนองว่า “ไม่พบข้อมูลที่ต้องการ” เนื่องจากสาเหตุหลายประการ โดยหนึ่งในสาเหตุเหล่านั้นก็คือการใช้คำสำคัญที่ยาวเกินไป สมมติว่าคุณต้องการค้นหาข้อมูลเกี่ยวกับ “การแยกตัวประกอบของพหุนาม” แต่ปรากฏว่าไม่มีข้อมูลที่ต้องการ เราก็เปลี่ยนคำสำคัญใหม่โดยการแตกคำสำคัญที่ยาวๆ นั้นให้สั้นลง แล้วใช้วิธีการเว้นวรรค หรือใช้เครื่องหมาย “ ” คร่อมคำสำคัญคู่ใดคู่หนึ่งแทน ในกรณีนี้ก็อาจเปลี่ยนไปใช้คำว่า “พหุนาม” “แยกตัวประกอบ” ก็ได้

เทคนิคที่ 5 การค้นหาข้อมูลที่เป็นราชทินนาม, ฐานันดรศักดิ์, บรรดาศักดิ์, ชื่อบุคคล

ในบางครั้งถ้าหากเราต้องการข้อมูลเกี่ยวกับสมาชิกในพระบรมราชวงศ์ บรรดาศักดิ์ของขุนนาง ชื่อของบุคคล เป็นต้น เราอาจพบว่าไม่มีข้อมูลที่ต้องการ สาเหตุประการหนึ่งก็คือคำสำคัญที่ยาวเกินไป ในกรณีนี้เทคนิคที่ 4 สามารถนำมาประยุกต์ใช้ได้ แต่ถ้าหากว่าเราต้องการค้นหาชื่อบุคคล เราก็สามารถประยุกต์ใช้เทคนิคที่ 4 ได้อีกเช่นกันโดยการแยกส่วนที่เป็นชื่อกับนามสกุลออกจากกัน เช่น ต้องการหาข้อมูลของ “ทักษิณ ชินวัตร” สมมติว่า search engine ไม่พบข้อมูลเกี่ยวกับ “ทักษิณ ชินวัตร” หรือพบแต่ไม่ใช่สิ่งที่เราต้องการ ก็เลี่ยงไปใช้คำสำคัญ “ทักษิณ” “ชินวัตร” แทนอย่างนี้เป็นต้น แต่อย่างไรก็ตามผมมีข้อสังเกตว่าการใช้คำสำคัญติดกันโดยการคร่อมด้วยเครื่องหมาย “ ” ก็อาจให้ทางเลือกที่ดีกว่าในการค้นหาและคัดเลือกข้อมูลโดยตัวเราเอง

เทคนิคที่ 6 ตรวจสอบตัวสะกดให้ถูกต้อง

สาเหตุหนึ่งที่ search engine ไม่พบข้อมูลที่ต้องการหรือผลการค้นหาไม่เป็นไปตามที่คาดหวังก็คือการสะกดคำที่ไม่ถูกต้อง ในกรณีนี้ส่วนใหญ่มักเกิดจากการใช้คำสำคัญภาาษต่างประเทศที่ใช้วิธีเขียนทับศัพท์เป็นภาษาไทยไปเลย หรือในกรณีคำสำคัญที่เป็นภาษาต่างประเทศ ก็คือตกตัวสะกดไปตัวหนึ่งหรือเขียนผิดไปตัวหนึ่งก็ทำให้ผลการค้นหาคลาดเคลื่อนได้เช่นกัน

เทคนิคที่ 7 การใช้ search engine เป็นเครื่องมือค้นหาเว็บไซต์ที่ต้องการ

ในบางครั้งถ้าเราต้องการเข้าไปยังเว็บไซต์หนึ่งแต่เราไม่แน่ใจหรือจำไม่ได้ว่าเว็บไซต์นั้นมี URL (Uniform Resource Locator) ว่าอย่างไร สมมติว่าคุณต้องการเข้ามายังเว็บไซต์ sudipan.net แต่ปรากฏว่าเราลืม URL ของเว็บนี้ วิธีที่ง่ายที่สุดก็คือใช้คำสำคัญซึ่งเป็นชื่อที่เรานึกออกว่าเป็นส่วนหนึ่งของชื่อเว็บไซต์นั้น ซึ่งในกรณีนี้สมมติผมใช้คำสำคัญว่า “sudipan” ก็จะได้ผลการค้นหาเป็นทุกๆ เว็บเพ็จที่มีคำว่า sudipan แต่เป้าหมายของเราคือต้องการเข้าไปยังเว็บไซต์ดังกล่าวไม่ใช่หาข้อมูล เกี่ยวกับ sudipan เราก็เลือกที่ลิงก์แรกซึ่งมี URL คือ http://www.sudipan.net นั่นเอง

เทคนิคที่ 8 การใช้คำสำคัญในทางตรรกศาสตร์     search engine หลายแห่งสามารถใช้คำในวิชาตรรกศาสตร์มาช่วยคัดเลือกข้อมูลได้ โดยจะเป็นผลให้จำนวนผลการค้นหาลดน้อยลงหรือเป็นไปตามที่เราคาดหวังมากขึ้น ซึ่งคำในวิชาตรรกศาสตร์ที่ใช้ได้มีดังต่อไปนี้ AND OR NOT สำหรับวิธีการใช้งานอย่างคร่าวๆ มีดังนี้
    1.) AND ใช้เมื่อต้องการให้ผลการค้นหาประกอบด้วยคำสำคัญที่อยู่ติดกับคำว่า AND ทั้งสองคำ เช่น “chemistry” AND “atomic theory” หมายความว่าให้ค้นหาข้อมูลที่มีคำว่า chemistry และคำว่า atomic theory ทั้ง 2 คำอยู่ในเอกสารเดียวกัน
    2. ) OR ใช้เมื่อต้องการให้ผลการค้นหาประกอบด้วยคำสำคัญตัวใดตัวหนึ่งที่อยู่ติดกับคำว่า OR เช่น “physics” OR “mechanics” หมายความว่าให้ค้นหาข้อมูลที่มีคำว่า physics หรือ mechanics คำใดคำหนึ่งก็ได้
3.) NOT ใช้เมื่อต้องการให้ผลการค้นหาประกอบด้วยคำสำคัญที่อยู่หน้าคำว่า NOT แต่ไม่ต้องค้นหาคำที่อยู่หลังคำว่า NOT     เช่น mathematics NOT calculus หมายความว่า ให้ค้นหาข้อมูลที่มีคำว่า mathematics แต่ต้องไม่มีคำว่า calculus อยู่ด้วย
หมายเหตุ เทคนิคที่ 8 นี้สามารถนำไปประยุกต์ใช้กับการค้นหาข้อมูลในฐานข้อมูลทรัพยากรห้องสมุดตามมหาวิทยาลัยได้ด้วย
เทคนิคที่ 9 การ search โดยระบุที่จะ search เฉพาะเวปหนึ่งๆ
เติมคำว่า site:แล้วตามด้วยเวปที่เราต้องการค้น ผลลัพธ์ที่ได้ก็จะออกมาเฉพาะในเวปนั้นๆ เช่นจะเข้าไปฟังเพลงในเวป ก็สามารถหาได้โดย my best friend site:bignose.exteen.com

การทำงานของ Search Engine ประกอบไปด้วย ๓ ส่วนหลัก ๆ คือ

๑. Spider หรือ Web Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่างๆ แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Spider มักจะเข้าไปอัพเดทข้อมูลเป็นรายเดือน

๒. ฐานข้อมูล (Database) เป็นส่วนที่เก็บรายการเว็บไซต์ ฐานข้อมูลที่ดีควรจะมีขนาดใหญ่เพียงพอที่จะรองรับกับการเติบโตของเว็บไซต์ในปัจจุบัน การออกแบบฐานข้อมูลที่ดีก็เป็นส่วนสำคัญเพราะถ้าฐานข้อมูลออกแบบมาทำงานช้าก็ทำให้การรอผลนานและจะไม่ได้รับความนิยมไปในที่สุด

๓.โปรแกรม Search Engine มีหน้าที่รับคำหรือข้อความที่ผู้ใช้งานป้อนเข้ามา แล้วเข้าค้นหาตามเว็บไซต์ต่างๆ ที่จัดเก็บไว้ในฐานข้อมูล จากนั้นก็จะรายงานผลเว็บไซต์ที่ค้นพบให้กับผู้ใช้ การสืบค้นด้วยวิธีนี้นอกจากจะต้องมีระบบการสืบค้นข้อมูลที่รวดเร็วและมีประสิทธิภาพแล้ว การกลั่นกรองผลที่ได้ เพื่อให้ตรงกับความต้องการของผู้ใช้ก็เป็นอีกส่วนหนึ่งที่สำคัญของการสืบค้นข้อมูล
ดังนั้น การเลือกใช้เครื่องมือในการค้นหาจะต้องเข้าใจว่า ข้อมูลที่ต้องการค้นหานั้นมีลักษณะอย่างไร มีขอบข่ายกว้างขวางหรือแคบขนาดไหน แล้วจึงเลือกใช้เว็บไซต์ค้นหาที่ให้บริการตรงกับความต้องการ

ระบบของโปรแกรม Google

กูเกิลเก็บข้อมูลเว็บโดยการส่งโปรแกรมเก็บข้อมูลเว็บไซต์ เรียกว่า สไปเดอร์ (spider หรืออีกชื่อคือ web crawler) ซึ่งเป็นโรบอต (robot) ชนิดหนึ่ง สไปเดอร์จะถูกส่งไปตามเว็บไซต์ โดยวิ่งไปตามลิงค์ต่าง ๆ ของแต่ละเว็บไซต์ เพื่อไปยังอีกเว็บไซต์หนึ่ง และเมื่อครบระยะเวลาหนึ่ง สไปเดอร์จะทำการประมวลผล เพื่อจัดลำดับในการแสดงผลโดยใช้ระบบเฉพาะของทางกูเกิลเอง ระบบจัดอันดับความเกี่ยวข้องของเว็บเพจแต่ละหน้าของกูเกิลเรียกว่า เพจแรงก์ (PageRank) ได้จดสิทธิบัตรใน พ.ศ. 2544

หลักการทำงาน

เว็บคราวเลอร์ ( Web Crawler) หรือที่รู้จักกันดีในชื่อ เว็บสไปเดอร์ ( Web Spider ) หรือ เว็บโรบอท ( Web Robot ) เป็นโปรแกรมที่ทำงานด้วยตัวเอง โดยจะเชื่อมต่อกับเครือข่ายอินเตอร์เน็ต เก็บข้อมูลเพื่อจุดประสงค์ใดจุดประสงค์หนึ่ง เช่น เก็บ E-mail Address ( เพื่อนำไปใช้สแปมอีเมล์ )
เว็บคราวเลอร์ที่ใช้กันอยู่ในปัจจุบันทั่วไปและมีการวิจัยกันมากคือ ใช้ในการทำงานเกี่ยวกับระบบ เสิร์จเอนจิ้น โดยเว็บคราวเลอร์ทำหน้าที่เก็บรวบรวมข้อมูลเว็บเพจในระบบอินเตอร์เน็ต เพื่อนำมาใช้ในการทำดัชนี ทำเป็นระบบเสิร์จเอนจิ้นต่อไป
หลักการทำงานของเว็บคราวเลอร์แบบพื้นฐานคือ การเริ่มต้นดาวน์โหลดเว็บเพจจากยูอาร์แอลเริ่มต้น หรือที่เรียกว่า Seed URLs ยูอาร์แอลเริ่มต้นอาจจะเป็นชุดของ ยูอาร์แอลหรือยูอาร์แอลเดียวก็ได้ เมื่อเว็บคราวเลอร์ดาวน์โหลดหน้าเอกสารเว็บเพจจากยูอาร์แอลที่ดาวน์โหลดมาแล้ว เว็บคราวเลอร์จะทำการวิเคราะห์ หายูอาร์แอลลิงค์ทั้งหมดในหน้าเว็บเพจนั้น เพื่อนำไปใช้ดาวน์โหลดเก็บข้อมูล ทำวนซ้ำต่อไปเรื่อยๆ

ประโยชน์ของการค้นข้อมูลโดยใช้ search engine

        1. ค้นหาเว็บที่ต้องการได้สะดวก รวดเร็ว
        2. สามารถค้นหาแบบเจาะลึกได้ ไม่ว่าจะเป็น รูปภาพ, ข่าว, MP3 และอื่นๆ อีกมากมาย
        3. สามารถค้นหาจากเว็บไซต์เฉพาะทาง ที่มีการจัดทำไว้ เช่น download.com เว็บไซต์เกี่ยวกับข้อมูลและซอร์ฟแวร์ เป็นต้น
        4. มีความหลากหลายในการค้นหาข้อมูล
        5. รองรับการค้นหา ภาษาไทย

สถิติการใช้ web ที่มีการทำงานในระบบของ search engine ในปัจจุบัน

Search Engine ที่นิยมใช้นั้นมีด้วยกันหลายตัวด้วยกัน โดย 3 อันดับแรกที่มีผู้นิยมใช้มากทั่วโลกได้แก่

1. GOOGLE

GOOGLE ( www. google.com) เป็น Search Engine ที่ให้บริการค้นหาข้อมูลฟรี ๆ ที่โดดเด่นและเป็นผู้นำในเรื่องของความเร็วในการค้นหา ความถูกต้องของข้อมูล และความลึกในการค้นหาข้อมูล ผลลัพธ์ที่ได้นั้นมีให้เลือกมากมาย จนอาจจะทำให้คุณเลือกไม่ถูกว่าอันไหนคือข้อมูลที่คุณต้องการจริง ๆ เบื้องหลังของฉากหน้าที่ดูเรียบง่าย GOOGLE ได้มีการปรับแต่งระบบและกลไกในการค้นหา ให้มีความสามารถเพิ่มเติมมากมาย มีหลากหลายภาษา เพื่อให้รองรับกับการใช้งานตามลักษณะของแต่ละประเทศ ซึ่งสำหรับประเทศไทย จะใช้ http://www.google.co.th/

2. DOGPILE
DOGPILE ( www.dogpile.com ) เป็น Search Engine อีกตัวหนึ่ง ซึ่งถึงแม้ว่า DOGPILE จะเป็นที่ 2 รองจาก GOOGLE แต่ DOGPILE ก็มีระบบการทำงานที่น่าดึงดูดใจ ที่อาจจะทำให้ผู้ใช้ GOOGLE เปลี่ยนใจได้ง่าย ๆ การค้นหาของ DOGPILE จะมีการรวบรวมผลลัพธ์จากหลายๆ เว็บเข้าไว้ด้วยกัน แต่อย่างไรก็ตามผลลัพธ์ที่ได้ก็ไม่ได้มาจากที่ใดที่หนึ่งเป็นหลัก บริการของ DOGPILE จะเป็นการรวบรวมลิงค์ของผลลัพธ์ที่ได้จากการค้นหามาไว้รวมกันนอกจากนี้ DOGPILE ยังมีสมุดหน้าขาวและหน้าเหลือง ที่เตรียมเอาไว้สำหรับให้ท่านค้นหาบุคคลหรือธุรกิจต่าง ๆ อีกด้วย

3. ALLTHEWEB

ALLTHEWEB ( www.alltheweb.com ) เป็น Search Engine ตัวที่นิยมเป็นอันดับที่ 3 ที่บริการของ ALLTHEWEB นั้น จะมีรูปร่างและหน้าตาคล้าย ๆ กับ GOOGLE แต่ก็เป็นบริการที่มีระบบการค้นหาอันยอดเยี่ยมอีกแห่งหนึ่ง ระบบสารบัญของเว็บนั้นสามารถแข่งขันกับ GOOGLE และ YAHOO ได้ทั้งในเรื่องความถูกต้องแม่นยำ และความรวดเร็วในการค้น หา มีบริการให้ค้นหาไฟล์ที่ชื่อว่า AllTheWeb FTP Files Search นอกจากนี้แล้ว ALLTHEWEB ยังมีระบบกรองข้อมูลอันยอดเยี่ยม ที่จะตัดและกรองเว็บโป๊ต่าง ๆ ออกจากผลลัพธ์ในการค้นหาของท่าน เหมาะสำหรับป้องกันไม่ให้ลูกหลานของท่านเข้าไปใช้บริการในทางที่ผิด ๆ

ตัวอย่างเว็บไซต์ Search enging ของประเทศไทย
เช่น www.geocities.com/proconsultanttean
เป็นเว็บไซต์ที่ดำเนินธุรกิจออกแบบติดตั้ง ให้คำปรึกษา และปรับแต่งและแก้ไข ระบบเครือข่ายคอมพิวเตอร์โดยเฉพาะระบบเครือข่ายคอมพิวเตอร์ที่ใช้ผลิตภัณฑ์ของไมโครซอฟท์ เช่น Windows NT, Windows 2000, Windows 98, Microsoft Backoffice, .NETEnterprise

ตัวอย่างเว็บไซต์ Search enging ของต่างประเทศ
เช่น http://www.cnet.com/
เป็น website สำหรับค้นหาเรื่องราวเกี่ยวกับเครื่องมือสารสนเทศ เช่น computer palm notebook สินค้าต่าง ๆที่เกี่ยวกับด้านเทคโนโลยี การพัฒนา software แนะนำวิธีการใช้ และมีการเสนอขาย สินค้าต่างๆผ่านทาง web

วันอังคารที่ 18 มกราคม พ.ศ. 2554

ความรู้เกี่ยวกับ search engine

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

เกี่ยวกับฉัน

คลังบทความของบล็อก