2015/Jul/16

 
 
คนที่มีเว็บไซต์เป็นของตัวเอง และใช้งาน Google Analytics (GA) เพื่อสำรวจยอดผู้ชม หรือเพื่อการตลาด คุณอาจสังเกตเห็นความผิดปกติกับสถิติการเข้าชมเว็บไซต์ เพราะบางวันมียอดวิวพุ่งสูงกว่าปกติ และจู่ๆ Bounce rate ก็ทะยานขึ้นไปเกิน 50% รวมถึง Average Session Duration ที่น้อยกว่า 00:00:30 หรือเข้าใกล้ 00:00:00 ซึ่งเป็นสถานะที่น่ากังวลสำหรับเว็บไซต์ บางคนอาจคิดว่าเป็นเรื่องดีที่มียอดคลิกดูเว็บไซต์สูงขึ้น โดยหารู้ไม่ว่านั่นคือบ็อต หรือ สแปม ที่เข้ามาก่อกวนสถิติเว็บไซต์ 
 
 
บ็อตเหล่านี้แต่เดิมมาจากรัสเซีย แต่ปัจจุบันมีทั้งจากสหราชอาณาจักร และจากสหรัฐอเมริกา ส่วนจะมีขึ้นเพราะจุดประสงค์อะไรก็ลองหาอ่านสมมติฐานได้จากเว็บต่างชาติค่ะ คีย์เวิร์ดคือ spam, referral บ็อตเหล่านี้อาจมีชื่อโดเมนต่างๆ กัน แต่ IP Address มักจะมาจากที่เดียวกัน ซึ่งมีอยู่ไม่กี่ IP ได้แก่
 
 
 
สำหรับคนทำธุรกิจย่อมต้องการเห็นจำนวนลูกค้าที่แท้จริงที่เข้าเว็บไซต์เพื่อวิเคราะห์การตลาดได้ดีขึ้น แต่สแปมที่เข้ามาในเว็บไซต์เหล่านี้ทำให้เจ้าของเว็บแยกไม่ออกว่าคลิกไหนคือคนจริงๆ คลิกไหนคือบ็อตกันแน่ ทำให้การทำ SEO มีปัญหา 
 
วิธีดูว่าคลิกที่เข้ามาในเว็บไซต์เป็นคนจริงๆ หรือเป็นบ็อต เช็คได้จากหน้า Reporting ใน GA โดย
  • ไปที่ Acquisition > All Traffic > Source/Medium
  • จากนั้นลองคลิกที่ (direct) / (none) หรือไม่ก็ google / organic
  • แล้วเลือก Secondary dimension > Behavior > Hostname
  • ที่ช่อง Hostname ถ้ามีโดเมนที่ไม่ใช่ชื่อโดเมนของเราขึ้นมาล่ะก็ นั่นคือบ็อต/สแปม ที่พบบ่อยคือ google.es และ google.fr และ x.com และ g.com ฯลฯ
 
 
เมื่อปีที่แล้วเริ่มมีคนสังเกตเห็นความผิดปกตินี้และเริ่มหาวิธีคัดกรองหรือสกัดบ็อตเหล่านี้ไม่ให้เข้ามาในเว็บไซต์ วิธีที่พูดถึงกันมากก็คือ การแบน IP Address หรือโดเมนเนมโดยใช้ Filters ใน Google Analytics หรือจัดการที่เว็บไซต์ด้วยการใส่โค้ด JAVA Script หรือใส่โค้ดในไฟล์ .htaccess ซึ่งมีการยืนยันแล้วว่าไม่ได้ผล เราไม่สามารถสกัดหรือป้องกันบ็อตเหล่านี้เข้าสู่เว็บไซต์ของเราได้ วิธีการที่ดีที่สุดที่จะให้ GA แสดงสถิติที่ใกล้เคียงความจริงที่สุดในเวลานี้ คือ การสร้าง Segment หรือใส่ค่า regex (regular expressions) ที่เป็น IP Address และโดเมนเนมใน Filters
 
คุณ Pornthep Khetrum ได้อธิบายถึงสแปมเหล่านี้ไว้ใน Google Analytics Thailand แต่วิธีการที่แนะนำคร่าวๆ ให้ใส่ชื่อโดเมนใน PROPERTY > Tracking Info > Referral Exclusion List อาจจะไม่ได้ผล อีกทั้งชื่อโดเมนที่ต้องการคัดกรองมีมากเกินไป ซึ่งการคัดกรองที่ VIEW > Filters โดยใช้ Exclude > Filter Field = Campaign Source จะได้ผลดีกว่า เพราะสามารถใส่ regex โดเมนเนมได้หลายๆ ชื่อในคราวเดียวกัน (ไม่เกิน 255 ตัวอักษร)
 

 
สำหรับเว็บไซต์ในประเทศไทย ขอเพิ่มเติม Advanced > Conditions ใน segment ที่สร้างใหม่ ดังนี้
 
Filter > Sessions > Exclude
 Hostname > contains > (not set)

Filter > Users > Include
Country > exactly matches > Thailand
 
 
สำหรับการตั้งค่าที่ Admin > VIEW All Web Site Data
โดยใช้ Filters อ่านวิธีตั้งค่าที่นี่ (ภาษาอังกฤษ)
 
 
อาจจะเข้าใจยากสักนิดสำหรับผู้เริ่มใช้งาน GA แต่ถ้าตั้งค่าถูกต้องแล้วจะสามารถคัดกรองบ็อตเหล่านี้ออกไปได้อย่างหมดจดเลยทีเดียว และจะได้ข้อมูลทางสถิติของเว็บไซต์ที่ใกล้เคียงกับความจริงมากยิ่งขึ้นค่ะ