Web analytics adalah pengukuran, pengumpulan, analisis, dan pelaporan data web untuk memahami dan mengoptimalkan penggunaan web. Web analytics bukan hanya proses untuk mengukur lalu lintas web tetapi dapat digunakan sebagai alat untuk penelitian bisnis dan pasar serta menilai dan meningkatkan efektivitas situs web. Aplikasi web analytics juga dapat membantu perusahaan mengukur hasil kampanye periklanan cetak atau siaran tradisional. Hal ini dapat digunakan untuk memperkirakan bagaimana lalu lintas ke sebuah situs web berubah setelah meluncurkan kampanye iklan baru. Web analytics memberikan informasi tentang jumlah pengunjung ke sebuah situs web dan jumlah tampilan halaman, atau membuat profil perilaku pengguna. Hal ini membantu mengukur tren lalu lintas dan popularitas, yang berguna untuk penelitian pasar.
Tahap-tahap dasar dari proses web analytics
Kebanyakan proses web analytics menurun menjadi empat tahap atau langkah penting, yaitu:
Pengumpulan data: Tahap ini adalah pengumpulan data dasar. Biasanya, data ini adalah jumlah hal. Tujuan dari tahap ini adalah untuk mengumpulkan data. Pemrosesan data menjadi metrik: Tahap ini biasanya mengambil jumlah dan membuatnya menjadi rasio, meskipun masih mungkin ada beberapa jumlah. Tujuan dari tahap ini adalah untuk mengambil data dan mengonfirmasikannya menjadi informasi, khususnya metrik.
Mengembangkan KPI: Tahap ini berfokus pada menggunakan rasio (dan jumlah) dan menyatukannya dengan strategi bisnis, yang disebut sebagai key performance indicators (KPI). Banyak kali, KPI berurusan dengan aspek konversi, tetapi tidak selalu. Hal ini tergantung pada organisasi. Membentuk strategi online: Tahap ini berkaitan dengan tujuan, sasaran, dan standar online untuk organisasi atau bisnis. Strategi ini biasanya terkait dengan menghasilkan keuntungan, menghemat uang, atau meningkatkan pangsa pasar.
Fungsi penting lain yang dikembangkan oleh analis untuk optimasi situs web adalah eksperimen:
Eksperimen dan pengujian: Pengujian A/B adalah eksperimen yang dikontrol dengan dua varian, dalam pengaturan online, seperti pengembangan web. Tujuan dari pengujian A/B adalah untuk mengidentifikasi dan menyarankan perubahan pada halaman web yang meningkatkan atau memaksimalkan efek dari hasil yang diuji secara statistik. Setiap tahap memengaruhi atau dapat memengaruhi (yaitu, mendorong) tahap sebelum atau sesudahnya. Jadi, terkadang data yang tersedia untuk dikumpulkan mempengaruhi strategi online. Di lain waktu, strategi online mempengaruhi data yang dikumpulkan.
Kategori web analytics
Setidaknya ada dua kategori web analytics, yaitu web analytics off-site dan on-site.
Web analytics off-site mengacu pada pengukuran dan analisis web tanpa memperhatikan apakah seseorang memiliki atau menjaga situs web. Ini mencakup pengukuran audiens potensial sebuah situs web (kesempatan), pangsa suara (visibilitas), dan buzz (komentar) yang terjadi di Internet secara keseluruhan.
Web analytics on-site, yang lebih umum dari kedua, mengukur perilaku pengunjung setelah berada di situs web tertentu. Ini termasuk penggerak dan konversi; misalnya, tingkat sejauh mana halaman landing yang berbeda terkait dengan pembelian online. Web analytics on-site mengukur kinerja situs web tertentu dalam konteks komersial. Data ini biasanya dibandingkan dengan indikator kinerja kunci untuk kinerja dan digunakan untuk meningkatkan respons audiens situs web atau kampanye pemasaran. Google Analytics dan Adobe Analytics adalah layanan web analytics on-site yang paling banyak digunakan; meskipun alat baru sedang muncul yang memberikan lapisan informasi tambahan, termasuk peta panas dan sesi putar ulang.
Di masa lalu, web analytics telah digunakan untuk mengacu pada pengukuran kunjungan on-site. Namun, arti ini telah menjadi kabur, terutama karena vendor menghasilkan alat yang mencakup kedua kategori. Banyak vendor berbeda menyediakan perangkat lunak dan layanan web analytics on-site. Ada dua cara teknis utama untuk mengumpulkan data. Metode pertama dan tradisional, analisis file log server, membaca file log di mana server web mencatat permintaan file oleh browser. Metode kedua, penandaan halaman, menggunakan JavaScript yang tertanam di halaman web untuk membuat permintaan gambar ke server analytics khusus pihak ketiga, setiap kali sebuah halaman web dirender oleh browser web atau, jika diinginkan, ketika klik mouse terjadi. Keduanya mengumpulkan data yang dapat diproses untuk menghasilkan laporan lalu lintas web.
Analisis web di tempat
Tidak ada definisi yang disepakati secara global dalam analisis web karena badan-badan industri telah berusaha untuk setuju pada definisi yang berguna dan definitif untuk beberapa waktu, yaitu mengatakan, metrik dalam alat dan produk dari perusahaan yang berbeda mungkin memiliki cara yang berbeda untuk mengukur, menghitung, sebagai hasilnya, nama metrik yang sama dapat mewakili arti data yang berbeda. Badan-badan utama yang telah memberikan masukan dalam area ini adalah IAB (Biro Periklanan Interaktif), JICWEBS (Komite Industri Gabungan untuk Standar Web di Inggris dan Irlandia), dan DAA (Asosiasi Analitik Digital), yang sebelumnya dikenal sebagai WAA (Asosiasi Analitik Web, AS). Namun, banyak istilah digunakan secara konsisten dari satu alat analitik utama ke yang lain, sehingga daftar berikut, berdasarkan konvensi tersebut, dapat menjadi titik awal yang berguna:
Tingkat pentalan - Persentase kunjungan yang merupakan kunjungan halaman tunggal dan tanpa interaksi lain (klik) pada halaman tersebut. Dengan kata lain, satu klik dalam sesi tertentu disebut sebagai pentalan. Tingkat pentalan yang tinggi dapat menunjukkan bahwa konten atau pengalaman pengguna perlu ditingkatkan. Jalur klik - urutan kronologis tampilan halaman dalam suatu kunjungan atau sesi. Analisis jalur ini memberikan informasi tentang tujuan sesi pengguna dan tujuan pengguna.
Hit - Permintaan untuk file dari webserver. Tersedia hanya dalam analisis log. Jumlah hit yang diterima oleh sebuah situs web sering dikutip untuk menegaskan popularitasnya, tetapi angka ini sangat menyesatkan dan secara dramatis melebih-lebihkan popularitas. Satu halaman web biasanya terdiri dari beberapa (sering puluhan) file diskrit, masing-masing dihitung sebagai hit saat halaman tersebut diunduh, sehingga jumlah hit adalah angka sewenang-wenang yang lebih mencerminkan kompleksitas halaman individu di situs web daripada popularitas sebenarnya situs web. Jumlah total kunjungan atau tampilan halaman memberikan penilaian yang lebih realistis dan akurat tentang popularitas.
Tampilan halaman (tampilan halaman) - Permintaan untuk file, atau kadang-kadang suatu peristiwa seperti klik mouse, yang didefinisikan sebagai halaman dalam pengaturan alat analisis web. Biasanya, jumlah tampilan halaman lebih dari Kunjungan dan Pengunjung (Pengunjung Unik). Suatu kejadian dari script yang dijalankan dalam penandaan halaman. Dalam analisis log, satu tampilan halaman dapat menghasilkan beberapa hit karena semua sumber daya yang diperlukan untuk melihat halaman (gambar, file .js dan .css) juga diminta dari server web. Sebuah "refresh" dari halaman web yang sama dapat dihitung sebagai tampilan halaman lainnya. Sebagai contoh, pada pukul 16:07, pengguna melihat halaman A, dan 2 detik kemudian, pengguna mengklik tombol "refresh" di peramban, dan jumlah tampilan halaman halaman A kemudian adalah 2.
Pengunjung/pengunjung unik/pengguna unik - Klien yang diidentifikasi secara unik yang menghasilkan tampilan halaman atau hit dalam waktu tertentu (mis. hari, minggu, atau bulan). Sebuah klien yang diidentifikasi secara unik biasanya merupakan kombinasi dari mesin (misalnya komputer desktop seseorang di tempat kerja) dan browser (Firefox di komputer tersebut). Identifikasi biasanya melalui cookie persisten yang ditempatkan di komputer oleh kode halaman situs. Metode yang lebih tua, yang digunakan dalam analisis file log, adalah kombinasi unik dari alamat IP komputer dan informasi User-Agent (browser) yang diberikan kepada server web oleh browser. "Pengunjung" tidak sama dengan manusia yang duduk di depan komputer pada saat kunjungan, karena seorang manusia individu dapat menggunakan komputer yang berbeda atau, pada komputer yang sama, dapat menggunakan browser yang berbeda, dan akan dianggap sebagai pengunjung yang berbeda dalam setiap keadaan. Semakin banyak, tetapi masih, agak jarang, pengunjung diidentifikasi secara unik oleh Flash LSO's (Local Shared Objects), yang kurang rentan terhadap penegakan privasi.
Kunjungan/sesi - Kunjungan atau sesi didefinisikan sebagai serangkaian permintaan halaman atau, dalam kasus penanda, permintaan gambar dari klien yang diidentifikasi secara unik yang sama. Biasanya, jumlah Kunjungan lebih dari Pengunjung (Pengunjung Unik). Klien unik biasanya diidentifikasi dengan alamat IP atau ID unik yang ditempatkan dalam cookie browser. Sebuah kunjungan dianggap berakhir saat tidak ada permintaan yang direkam dalam beberapa menit yang berlalu. Batas 30 menit ("time out") digunakan oleh banyak alat analitik tetapi dapat, dalam beberapa alat (seperti Google Analytics dan Plausible Analytics), diubah menjadi jumlah menit yang lain. Pengumpul data analitik dan alat analisis tidak memiliki cara yang dapat diandalkan untuk mengetahui apakah pengunjung telah melihat situs lain di antara tampilan halaman; suatu kunjungan dianggap sebagai satu kunjungan selama peristiwa (tampilan halaman, klik, apa pun yang direkam) berlangsung 30 menit atau kurang dekat bersama. Sebuah kunjungan dapat terdiri dari satu tampilan halaman atau ribuan. Sesi kunjungan unik juga dapat diperpanjang jika waktu antara tampilan halaman menunjukkan bahwa pengunjung telah melihat tampilan halaman secara terus menerus.
Waktu aktif/waktu keterlibatan - Jumlah rata-rata waktu yang dihabiskan pengunjung berinteraksi dengan konten pada halaman web, berdasarkan gerakan mouse, klik, hovers, dan gulir. Berbeda dengan durasi sesi dan durasi tampilan halaman/waktu di halaman, metrik ini dapat mengukur dengan akurat panjang keterlibatan dalam tampilan halaman terakhir, tetapi tidak tersedia dalam banyak alat analitik atau metode pengumpulan data.
Kedalaman halaman rata-rata/tampilan halaman per sesi rata-rata - Kedalaman halaman adalah "ukuran" kunjungan rata-rata, dihitung dengan membagi jumlah total tampilan halaman oleh jumlah total kunjungan. Durasi tampilan halaman rata-rata - Jumlah rata-rata waktu yang dihabiskan pengunjung pada halaman rata-rata situs. Klik - "mengacu pada satu instansi pengguna mengikuti hyperlink dari satu halaman di situs ke halaman lain".
Peristiwa - Tindakan diskrit atau kelas tindakan yang terjadi pada sebuah situs web. Sebuah tampilan halaman adalah jenis peristiwa. Peristiwa juga mencakup klik, pengiriman formulir, peristiwa penekanan tombol, dan tindakan pengguna sisi klien lainnya. Tingkat keluar/% keluar - Statistik yang diterapkan pada halaman individu, bukan situs web. Persentase kunjungan yang melihat halaman di mana halaman tersebut adalah halaman terakhir yang dilihat dalam kunjungan.
Segmentasi Data - Alat analisis web memungkinkan segmentasi data, yang berarti memecah data menjadi subset-subset yang lebih kecil berdasarkan kriteria seperti demografi, lokasi, atau perilaku. Ini memberikan pemahaman yang lebih dalam tentang segmen audiens yang berbeda.
Kunjungan pertama/sesi pertama - (juga disebut 'Pengunjung Unik Mutlak' dalam beberapa alat) Kunjungan dari klien yang diidentifikasi secara unik yang secara teoritis belum melakukan kunjungan sebelumnya. Karena satu-satunya cara untuk mengetahui apakah klien yang diidentifikasi secara unik tersebut telah mengunjungi situs sebelumnya adalah keberadaan cookie persisten atau melalui digital fingerprinting yang diterima pada kunjungan sebelumnya, label Kunjungan Pertama tidak dapat diandalkan jika cookie situs telah dihapus sejak kunjungan sebelumnya.
Frekuensi/sesi per unik - Frekuensi mengukur seberapa sering pengunjung datang ke sebuah situs web dalam periode tertentu. Ini dihitung dengan membagi total jumlah sesi (atau kunjungan) oleh total jumlah pengunjung unik selama periode tertentu, seperti sebulan atau setahun. Kadang-kadang digunakan secara bergantian dengan istilah "loyalitas."
Impresi - Definisi paling umum dari impresi adalah satu contoh iklan muncul di halaman yang dilihat. Sebuah iklan dapat ditampilkan pada halaman yang dilihat di bawah area yang ditampilkan di layar, sehingga sebagian besar ukuran impresi tidak selalu berarti iklan telah terlihat. Pengunjung baru - Pengunjung yang tidak membuat kunjungan sebelumnya. Definisi ini menciptakan sejumlah kebingungan (lihat kebingungan umum di bawah), dan kadang-kadang diganti dengan analisis kunjungan pertama.
Waktu dilihat halaman/waktu keterlihatan halaman/durasi tampilan halaman - Waktu sebuah halaman tunggal (atau blog, spanduk iklan) berada di layar, diukur sebagai perbedaan yang dihitung antara waktu permintaan untuk halaman tersebut dan waktu permintaan berikutnya yang tercatat. Jika tidak ada permintaan berikutnya yang tercatat, maka waktu tampilan dari instansi halaman tersebut tidak dimasukkan dalam laporan.
Pengunjung ulang - Pengunjung yang telah membuat setidaknya satu kunjungan sebelumnya. Periode antara kunjungan terakhir dan saat ini disebut sebagai kelengkapan pengunjung dan diukur dalam hari.
Pengunjung kembali - Pengunjung unik dengan aktivitas yang terdiri dari kunjungan ke sebuah situs selama periode pelaporan dan di mana pengunjung unik mengunjungi situs sebelum periode pelaporan. Individu dihitung hanya sekali selama periode pelaporan.
Durasi sesi/durasi kunjungan - Jumlah rata-rata waktu yang dihabiskan pengunjung di situs setiap kali mereka mengunjunginya. Dihitung sebagai total durasi semua sesi dibagi oleh total jumlah sesi. Metrik ini dapat menjadi rumit karena program analitik tidak dapat mengukur panjang tampilan halaman terakhir. Kunjungan halaman tunggal/singleton - Kunjungan di mana hanya satu halaman yang dilihat (ini bukan 'pentalan'). Site overlay adalah teknik laporan di mana statistik (klik) atau hotspot ditumpangkan, berdasarkan lokasi fisik, pada gambaran visual halaman web.
Tingkat klik adalah rasio pengguna yang mengklik tautan spesifik dengan jumlah total pengguna yang melihat halaman, email, atau iklan. Ini umum digunakan untuk mengukur keberhasilan kampanye periklanan online untuk situs web tertentu serta keefektifan kampanye email. Definisi "umum" lain dari tingkat klik (CTR) adalah total jumlah klik dibagi oleh total jumlah Impressions, karena metrik Tingkat Klik adalah untuk mengukur rasio klik dan impresi, bukan jumlah pengguna (yang mengklik dan melihat).
Analitik web luar situs didasarkan pada analisis data terbuka, eksplorasi media sosial, dan pangsa suara pada properti web. Biasanya digunakan untuk memahami cara memasarkan sebuah situs dengan mengidentifikasi kata kunci yang dihubungkan dengan situs ini, baik dari media sosial maupun dari situs web lain.
Sumber data analitik web
Tujuan utama analitik web adalah untuk mengumpulkan dan menganalisis data terkait lalu lintas web dan pola penggunaan. Data utamanya berasal dari empat sumber:
Data permintaan HTTP langsung: langsung berasal dari pesan permintaan HTTP (header permintaan HTTP). Data tingkat jaringan dan yang dihasilkan oleh server yang terkait dengan permintaan HTTP: bukan bagian dari permintaan HTTP, tetapi diperlukan untuk transmisi permintaan yang berhasil - misalnya, alamat IP pemberi permintaan. Data level aplikasi yang dikirim bersama permintaan HTTP: dihasilkan dan diproses oleh program level aplikasi (seperti JavaScript, PHP, dan ASP.Net), termasuk sesi dan rujukan. Biasanya ditangkap oleh log internal daripada layanan analitik web publik.
Data eksternal: dapat digabungkan dengan data di situs untuk membantu melengkapi data perilaku situs web yang dijelaskan di atas dan menginterpretasikan penggunaan web. Misalnya, alamat IP biasanya terkait dengan wilayah geografis dan penyedia layanan internet, tingkat buka dan klik e-mail, data kampanye surat langsung, penjualan, riwayat lead, atau jenis data lain yang diperlukan.
Analisis file log server web
Server web mencatat beberapa transaksinya dalam file log. Kemudian disadari bahwa file log ini bisa dibaca oleh program untuk memberikan data tentang popularitas situs web. Maka munculah perangkat lunak analisis log web.
Pada awal tahun 1990-an, statistik situs web terutama terdiri dari menghitung jumlah permintaan klien (atau hits) yang dilakukan ke server web. Ini merupakan metode yang wajar pada awalnya karena setiap situs web sering terdiri dari satu file HTML. Namun, dengan pengenalan gambar dalam HTML, dan situs web yang meliputi beberapa file HTML, hitungannya menjadi kurang berguna. Analisis Log Pertama yang sebenarnya dirilis oleh IPRO pada tahun 1994.
Dua unit ukur diperkenalkan pada pertengahan tahun 1990-an untuk mengukur lebih akurat jumlah aktivitas manusia di server web. Ini adalah tampilan halaman dan kunjungan (atau sesi). Tampilan halaman didefinisikan sebagai permintaan yang dilakukan ke server web untuk sebuah halaman, bukan gambar, sedangkan kunjungan didefinisikan sebagai urutan permintaan dari klien yang diidentifikasi secara unik yang kedaluwarsa setelah waktu tidak aktif tertentu, biasanya 30 menit.
Munculnya laba-laba mesin telusur dan robot pada akhir tahun 1990-an, bersama dengan proxy web dan alamat IP yang diberikan secara dinamis untuk perusahaan besar dan ISP, membuat lebih sulit untuk mengidentifikasi pengunjung manusia unik ke sebuah situs web. Analisis log merespons dengan melacak kunjungan berdasarkan cookie, dan dengan mengabaikan permintaan dari laba-laba yang dikenal.
Penggunaan cache web yang luas juga menyajikan masalah bagi analisis file log. Jika seseorang mengunjungi halaman lagi, permintaan kedua sering akan diambil dari cache browser, sehingga tidak akan ada permintaan yang diterima oleh server web. Ini berarti jalur orang tersebut melalui situs hilang. Caching dapat dikalahkan dengan mengonfigurasi server web, tetapi hal ini dapat mengakibatkan kinerja yang buruk bagi pengunjung dan beban yang lebih besar pada server.
Pelacakan halaman
Kekhawatiran tentang akurasi analisis file log dalam keberadaan caching, dan keinginan untuk dapat melakukan analitik web sebagai layanan yang dioutsourcing, membawa pada metode pengumpulan data kedua, pelacakan halaman atau "beacon web".
Pada pertengahan tahun 1990-an, web counter sering dilihat - ini adalah gambar yang disertakan dalam halaman web yang menampilkan jumlah kali gambar tersebut diminta, yang merupakan perkiraan jumlah kunjungan ke halaman tersebut. Pada akhir tahun 1990-an, konsep ini berkembang untuk mencakup gambar tak terlihat kecil daripada yang terlihat, dan, dengan menggunakan JavaScript, untuk meneruskan bersama permintaan gambar informasi tertentu tentang halaman dan pengunjung. Informasi ini kemudian dapat diproses secara remote oleh perusahaan analitik web, dan statistik ekstensif dihasilkan.
Layanan analitik web juga mengelola proses memberikan cookie kepada pengguna, yang dapat mengidentifikasi mereka secara unik selama kunjungan mereka dan kunjungan berikutnya. Tingkat penerimaan cookie bervariasi secara signifikan antara situs web dan dapat memengaruhi kualitas data yang dikumpulkan dan dilaporkan.
Mengumpulkan data situs web menggunakan server pengumpulan data pihak ketiga (atau bahkan server pengumpulan data internal) memerlukan DNS tambahan oleh komputer pengguna untuk menentukan alamat IP server pengumpulan. Kadang-kadang, keterlambatan dalam menyelesaikan DNS lookup yang berhasil atau gagal dapat mengakibatkan data tidak terkumpul.
Dengan semakin populer solusi berbasis Ajax, alternatif untuk penggunaan gambar tak terlihat adalah dengan menerapkan panggilan kembali ke server dari halaman yang dirender. Dalam hal ini, ketika halaman dirender di browser web, sebuah potongan kode JavaScript akan memanggil kembali ke server dan meneruskan informasi tentang klien yang kemudian dapat diagregasi oleh perusahaan analitik web.
Analisis file log dan solusi penandaan halaman sama-sama tersedia untuk perusahaan yang ingin melakukan analitik web. Dalam beberapa kasus, perusahaan analitik web yang sama akan menawarkan kedua pendekatan tersebut. Pertanyaannya kemudian muncul mengenai metode mana yang seharusnya dipilih oleh sebuah perusahaan. Terdapat kelebihan dan kekurangan dari setiap pendekatan.
Kelebihan analisis file log
Kelebihan utama analisis file log dibandingkan dengan penandaan halaman adalah sebagai berikut:
Server web biasanya sudah menghasilkan file log, sehingga data mentah sudah tersedia. Tidak diperlukan perubahan pada situs web.
Data berada di server perusahaan dan berformat standar, bukan format propietari. Hal ini memudahkan perusahaan untuk beralih program nantinya, menggunakan beberapa program berbeda, dan menganalisis data historis dengan program baru.
File log menyediakan informasi tentang kunjungan dari robot mesin telusur, yang biasanya dikecualikan dari alat analitik yang menggunakan penandaan JavaScript. Mesin telusur ini bisa tidak mengeksekusi JavaScript pada halaman. Meskipun ini seharusnya tidak dilaporkan sebagai aktivitas manusia, informasi ini bermanfaat untuk optimasi mesin telusur.
File log tidak memerlukan DNS lookups tambahan atau TCP slow starts. Jadi tidak ada panggilan server eksternal yang dapat melambatkan kecepatan muat halaman, atau menghasilkan tampilan halaman yang tidak terhitung. Server web secara andal mencatat setiap transaksi yang dilakukannya, misalnya menyajikan dokumen PDF dan konten yang dihasilkan oleh skrip, dan tidak bergantung pada browser pengunjung untuk berkooperasi.
Kelebihan penandaan halaman
Kelebihan utama penandaan halaman dibandingkan dengan analisis file log adalah sebagai berikut:
Penghitungan diaktifkan dengan membuka halaman (diasumsikan bahwa klien web menjalankan skrip tag), bukan meminta data dari server. Jika sebuah halaman di-cache, hal itu tidak akan dihitung oleh analisis log berbasis server. Halaman yang di-cache dapat menyumbang hingga sepertiga dari semua tampilan halaman, yang dapat berdampak negatif pada banyak metrik situs.
Data dikumpulkan melalui komponen ("tag") di halaman, biasanya ditulis dalam JavaScript. Biasanya digunakan bersama dengan bahasa skrip di sisi server (seperti PHP) untuk memanipulasi dan (biasanya) menyimpannya di database. Skrip mungkin memiliki akses ke informasi tambahan tentang klien web atau pengguna, yang tidak dikirim dalam permintaan, seperti ukuran layar pengunjung dan harga barang yang dibelinya.
Penandaan halaman dapat melaporkan peristiwa yang tidak melibatkan permintaan ke server web, seperti interaksi dalam film Flash, penyelesaian formulir sebagian, peristiwa mouse seperti onClick, onMouseOver, onFocus, onBlur, dll. Layanan penandaan halaman mengelola proses pemberian cookie kepada pengunjung; dengan analisis file log, server harus dikonfigurasi untuk melakukannya. Penandaan halaman tersedia untuk perusahaan yang tidak memiliki akses ke server web mereka.
Faktor Ekonomi
Analisis file log hampir selalu dilakukan in-house. Penandaan halaman dapat dilakukan in-house, tetapi lebih sering disediakan sebagai layanan pihak ketiga. Perbedaan ekonomi antara dua model ini juga dapat menjadi pertimbangan bagi sebuah perusahaan dalam memutuskan mana yang harus dibeli.
Analisis file log biasanya melibatkan pembelian perangkat lunak sekali pakai; namun, beberapa vendor memperkenalkan jumlah tampilan halaman maksimum per tahun dengan biaya tambahan untuk memproses informasi tambahan. Selain penawaran komersial, beberapa alat analisis file log open-source tersedia secara gratis.
Untuk analisis file log data harus disimpan dan diarsipkan, yang seringkali berkembang dengan cepat. Meskipun biaya perangkat keras untuk melakukan ini minimal, overhead bagi departemen TI bisa cukup besar. Untuk analisis file log perangkat lunak harus dipelihara, termasuk pembaruan dan perbaikan keamanan. Vendor penandaan halaman kompleks mengenakan biaya bulanan berdasarkan volume yaitu jumlah tampilan halaman per bulan yang dikumpulkan.
Solusi mana yang lebih murah untuk diterapkan bergantung pada jumlah keahlian teknis dalam perusahaan, vendor yang dipilih, jumlah aktivitas yang terjadi di situs web, kedalaman dan jenis informasi yang dicari, dan jumlah situs web yang berbeda memerlukan statistik.
Terlepas dari solusi vendor atau metode pengumpulan data yang digunakan, biaya analisis dan interpretasi pengunjung web juga harus dimasukkan. Yaitu biaya mengubah data mentah menjadi informasi yang dapat digunakan. Ini bisa berasal dari penggunaan konsultan pihak ketiga, perekrutan analis web berpengalaman, atau pelatihan orang dalam yang sesuai. Analisis biaya-manfaat kemudian dapat dilakukan. Misalnya, berapa peningkatan pendapatan atau penghematan biaya yang bisa didapatkan dengan menganalisis data pengunjung web?
Metode hybrid
Beberapa perusahaan menghasilkan solusi yang mengumpulkan data melalui file log dan penanda halaman dan dapat menganalisis kedua jenis data tersebut. Dengan menggunakan metode hybrid, mereka bertujuan untuk menghasilkan statistik yang lebih akurat daripada masing-masing metode tersebut secara terpisah.
Geolokasi pengunjung
Dengan geolokasi IP, adalah mungkin untuk melacak lokasi pengunjung. Dengan menggunakan database geolokasi IP atau API, pengunjung dapat dilokalisasi hingga tingkat kota, wilayah, atau negara.
IP Intelligence, atau Internet Protocol (IP) Intelligence, adalah teknologi yang memetakan Internet dan mengkategorikan alamat IP berdasarkan parameter seperti lokasi geografis (negara, wilayah, negara bagian, kota, dan kode pos), jenis koneksi, Penyedia Layanan Internet (ISP), informasi proxy, dan lainnya. Generasi pertama IP Intelligence disebut sebagai teknologi geotargeting atau geolokasi. Informasi ini digunakan oleh bisnis untuk segmentasi audiens online dalam aplikasi seperti periklanan online, penargetan perilaku, lokalitas konten (atau lokalitas situs web), manajemen hak digital, personalisasi, deteksi penipuan online, pencarian lokal, analitik yang ditingkatkan, manajemen lalu lintas global, dan distribusi konten.
Analisis klik
Analisis klik, juga dikenal sebagai Clickstream, adalah jenis khusus dari analisis web yang memberikan perhatian khusus pada klik. Biasanya, analisis klik berfokus pada analisis di situs web. Seorang editor situs web menggunakan analisis klik untuk menentukan kinerja situs tertentu, dengan memperhatikan di mana pengguna situs mengklik.
Juga, analisis klik dapat terjadi secara real-time atau "tidak nyata", tergantung pada jenis informasi yang dicari. Biasanya, editor halaman depan situs media berita berlalu lintas tinggi akan ingin memantau halaman mereka secara real-time, untuk mengoptimalkan konten. Editor, desainer, atau pemangku kepentingan lainnya dapat menganalisis klik dalam rentang waktu yang lebih luas untuk membantu mereka menilai kinerja penulis, elemen desain, iklan, dll.
Data tentang klik dapat dikumpulkan dengan setidaknya dua cara. Idealnya, sebuah klik "dilacak" ketika terjadi, dan metode ini memerlukan beberapa fungsionalitas yang menangkap informasi relevan ketika peristiwa terjadi. Sebagai alternatif, seseorang dapat mengasumsikan bahwa tampilan halaman adalah hasil dari sebuah klik, dan oleh karena itu mencatat sebuah klik simulasi yang mengarah ke tampilan halaman tersebut.
Analisis siklus hidup pelanggan
Analisis siklus hidup pelanggan adalah pendekatan berpusat pada pengunjung untuk pengukuran. Tampilan halaman, klik, dan peristiwa lainnya (seperti panggilan API, akses ke layanan pihak ketiga, dll.) Semuanya terkait dengan seorang pengunjung individu daripada disimpan sebagai titik data terpisah. Analisis siklus hidup pelanggan berusaha untuk menghubungkan semua titik data ke dalam funnel pemasaran yang dapat memberikan wawasan tentang perilaku pengunjung dan optimasi situs web. Metrik umum yang digunakan dalam analisis siklus hidup pelanggan termasuk biaya akuisisi pelanggan (CAC), nilai seumur hidup pelanggan (CLV), tingkat churn pelanggan, dan skor kepuasan pelanggan.
Metode lain
Metode pengumpulan data lain terkadang juga digunakan. Packet sniffing mengumpulkan data dengan menyaring lalu lintas jaringan yang lewat antara server web dan dunia luar. Packet sniffing tidak melibatkan perubahan pada halaman web atau server web. Mengintegrasikan analisis web ke dalam perangkat lunak server web juga memungkinkan. Kedua metode ini mengklaim memberikan data real-time yang lebih baik daripada metode lainnya.
Sumber kebingungan umum dalam analisis web
Masalah hotel
Masalah hotel umumnya merupakan masalah pertama yang dihadapi oleh pengguna analisis web. Masalahnya adalah bahwa jumlah pengunjung unik untuk setiap hari dalam sebulan tidak menambah hingga total yang sama dengan pengunjung unik untuk bulan itu. Ini tampaknya menjadi masalah bagi pengguna yang tidak berpengalaman dalam perangkat lunak analisis apa pun yang mereka gunakan. Ini adalah sifat sederhana dari definisi metrik.
Cara memvisualisasikan situasinya adalah dengan membayangkan sebuah hotel. Hotel tersebut memiliki dua kamar (Kamar A dan Kamar B). Seperti yang ditunjukkan dalam tabel, hotel tersebut memiliki dua pengguna unik setiap hari selama tiga hari. Jumlah total tentang hari-hari tersebut adalah enam. Selama periode tersebut, setiap kamar memiliki dua pengguna unik. Jumlah total tentang kamar-kamar tersebut adalah empat.
Hanya tiga pengunjung yang telah berada di hotel selama periode ini. Masalahnya adalah bahwa seseorang yang menginap di sebuah kamar selama dua malam akan dihitung dua kali jika mereka dihitung sekali setiap hari, tetapi hanya dihitung sekali jika total untuk periode tersebut dilihat. Setiap perangkat lunak untuk analisis web akan menjumlahkannya dengan benar untuk periode yang dipilih, sehingga mengarah ke masalah ketika pengguna mencoba membandingkan total.
Pencemaran Analisis
Seiring dengan kemajuan internet, penyebaran lalu lintas bot otomatis telah menjadi masalah yang semakin meningkat bagi keandalan analisis web. Ketika bot menjelajah internet, mereka merender dokumen web dengan cara yang mirip dengan pengguna organik, dan sebagai hasilnya mungkin secara tidak sengaja memicu kode yang digunakan oleh analisis web untuk menghitung lalu lintas. Bersama-sama, pemicu insidental ini dari peristiwa analisis web memengaruhi interpretasi data dan inferensi yang dibuat berdasarkan data tersebut. IPM memberikan bukti konsep bagaimana Google Analytics serta pesaing mereka dengan mudah dipicu oleh strategi penempatan bot yang umum.[19][20]
Masalah dengan cookie pihak ketiga
Historisnya, vendor solusi analitik tag halaman telah menggunakan cookie pihak ketiga yang dikirim dari domain vendor daripada domain situs web yang sedang dibuka. Cookie pihak ketiga dapat menangani pengunjung yang melewati beberapa domain yang tidak terkait dalam situs perusahaan karena cookie selalu diolah oleh server vendor.
Namun, cookie pihak ketiga pada dasarnya memungkinkan pelacakan pengguna individu di situs berbeda dari perusahaan yang berbeda, memungkinkan vendor analitik untuk mengumpulkan aktivitas pengguna di situs di mana dia memberikan informasi pribadi dengan aktivitasnya di situs lain di mana dia mengira dia anonim. Meskipun perusahaan analitik web membantah melakukan hal ini, perusahaan lain seperti perusahaan yang menyediakan iklan banner telah melakukannya. Keberatan privasi tentang cookie oleh karena itu telah membuat sebagian kecil pengguna untuk memblokir atau menghapus cookie pihak ketiga. Pada tahun 2005, beberapa laporan menunjukkan bahwa sekitar 28% pengguna internet memblokir cookie pihak ketiga dan 22% menghapusnya setidaknya sekali sebulan. Kebanyakan vendor solusi tagging halaman sekarang telah beralih untuk menyediakan setidaknya opsi penggunaan cookie pihak pertama (cookie yang ditetapkan dari subdomain klien).
Masalah lainnya adalah penghapusan cookie. Ketika analitik web bergantung pada cookie untuk mengidentifikasi pengunjung unik, statistik tergantung pada cookie persisten untuk menyimpan ID pengunjung unik. Ketika pengguna menghapus cookie, mereka biasanya menghapus cookie pihak pertama dan ketiga. Jika hal ini dilakukan di antara interaksi dengan situs, pengguna akan muncul sebagai pengunjung baru di titik interaksi berikutnya. Tanpa ID pengunjung yang persisten dan unik, konversi, analisis aliran klik, dan metrik lain yang bergantung pada aktivitas pengunjung unik dari waktu ke waktu tidak dapat akurat.
Cookie digunakan karena alamat IP tidak selalu unik untuk pengguna dan dapat dibagikan oleh kelompok besar atau proxy. Dalam beberapa kasus, alamat IP dikombinasikan dengan user agent untuk mengidentifikasi pengunjung dengan lebih akurat jika cookie tidak tersedia. Namun, ini hanya sebagian memecahkan masalah karena seringkali pengguna di belakang server proxy memiliki user agent yang sama. Metode lain untuk mengidentifikasi pengguna secara unik merupakan tantangan teknis dan akan membatasi audiens yang dapat dilacak atau akan dianggap mencurigakan. Cookie mencapai standar terendah tanpa menggunakan teknologi yang dianggap sebagai perangkat lunak mata-mata dan memiliki cookie aktif mengarah pada kekhawatiran keamanan.
Metode analitik yang aman (metering)
Pengumpulan informasi pihak ketiga tunduk pada batasan jaringan dan keamanan yang diterapkan. Negara, Penyedia Layanan, dan Jaringan Pribadi bisa mencegah data kunjungan situs dari pergi ke pihak ketiga. Semua metode yang disebutkan di atas (dan beberapa metode lain yang tidak disebutkan di sini, seperti sampel) memiliki masalah sentral yaitu rentan terhadap manipulasi (baik inflasi maupun deflasi). Ini berarti metode ini tidak akurat dan tidak aman (dalam model keamanan yang wajar). Masalah ini telah diatasi dalam beberapa makalah, tetapi hingga saat ini solusi yang disarankan dalam makalah-makalah ini tetap bersifat teoritis.
Posting Komentar