O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
AWStats este un instrument util pentru analiza traficului web. Interfața HTML poate fi accesată prin browser, oferindu-vă informații ușoare despre cine vă vizionează site-ul. Acest tutorial vă va ghida prin instalarea, configurarea și securizarea AWStats pentru un server web Nginx pe Fedora 28.
Dacă nu ați instalat încă Nginx, faceți acest lucru acum:
sudo dnf install nginx
sudo systemctl enable --now nginx
În primul rând, va trebui să instalați câteva lucruri. Din fericire, acest lucru este foarte ușor, întrucât tot software-ul de care aveți nevoie este în depozitele Fedora:
sudo dnf install awstats httpd-tools php-fpm
httpd-tools
este un pachet care conține câteva instrumente de care vom avea nevoie, cum ar fi htpasswd
. A fost proiectat pentru a fi folosit cu Apache, dar majoritatea instrumentelor funcționează și cu Nginx. Celălalt instrument, php-fpm
ne permite să rulăm scripturi PHP de la Nginx.
Va trebui să activăm php-fpm
prin systemctl
:
sudo systemctl enable --now php-fpm
Va trebui să configurăm AWStats înainte de a putea folosi. Copiați fișierul de configurare model pentru a crea o configurație nouă pentru site-ul dvs.:
sudo cp /etc/awstats/awstats.model.conf /etc/awstats/awstats.<yoursitename>.conf
Editați acum fișierul:
sudoedit /etc/awstats/awstats.<yoursitename>.conf
Derulați în jos până la linia care spune LogFile="/var/log/httpd/access_log"
. Deoarece folosim Nginx în loc de Apache, trebuie să schimbăm acest lucru. Schimbă-l în LogFile="/var/log/nginx/access.log"
.
Apoi, derulați în jos până la linia care spune DirIcons="/awstatsicons"
. Dacă nu îl găsiți, tastați /DirIcons
, apoi apăsați ENTERpentru a trece la el. Schimbați această linie la DirIcons="../icon"
.
În cele din urmă, AWStats trebuie să știe ce site-ul web analizează. În acest fel, poate raporta lucruri precum utilizatorii care vin de pe site-uri externe. Cele două opțiuni de configurare relevante sunt aici SiteDomain
și HostAliases
. SiteDomain
va fi pur și simplu numele de domeniu al site-ului; și HostAliases
va fi o listă cu orice alte nume de domeniu care ar putea fi utilizate (de exemplu, dacă site-ul dvs. este www.example.com
, puteți pune example.com
aici dacă este același site).
Toate opțiunile de configurare sunt documentate în fișierul de configurare. Dacă doriți să știți exact ce face o opțiune sau dacă doriți să vedeți toate opțiunile pe care AWStats trebuie să le ofere, citiți doar comentariile din acel fișier.
Este recomandat să nu rulați AWStats ca utilizator root. Vom rula AWStats sub nginx
utilizatorul care a fost deja configurat în timpul instalării Nginx.
Pentru a face acest lucru, va trebui să facem nginx
proprietarul directorului în care AWStats își stochează baza de date ( /var/lib/awstats
):
sudo chown -R nginx /var/lib/awstats
Într-un pas ulterior, vom configura AWStats pentru a rula atunci când jurnalele serverului sunt rotite. Totuși, pentru prima dată, este mai bine să o executați manual. Faceți asta cu următoarea comandă:
sudo -u nginx /usr/share/awstats/wwwroot/cgi-bin/awstats.pl -config=<yoursitename>
Notă: parte spune pentru a executa comanda ca utilizatorul , mai degrabă decât ca root.-u nginx
sudo
nginx
Produsul va fi similar cu următoarele:
Create/Update database for config "/etc/awstats/awstats.<yoursitename>.conf" by AWStats version 7.7 (build 20180105)
From data in log file "/var/log/nginx/access.log"...
Phase 1: First bypass old records, searching new record...
Direct access after last parsed record (after line 0)
Jumped lines in file: 0
Found 0 already parsed records.
Parsed lines in file: 0
Found 0 dropped records,
Found 0 comments,
Found 0 blank records,
Found 0 corrupted records,
Found 0 old records,
Found 0 new qualified records.
În continuare, vom configura Nginx astfel încât să putem vizualiza statisticile site-ului nostru de pe site-ul propriu, mai degrabă decât printr-o interfață de linie de comandă. Editați fișierul principal de configurare Nginx:
sudoedit /etc/nginx/nginx.conf
Aici, vom adăuga un folder pentru a conține secțiunea AWStats a site-ului. În acest tutorial, îl vom suna webstats
, dar îl puteți numi orice doriți.
Găsiți secțiunea fișierului de configurare care spune server
. După linie include /etc/nginx/default.d/*.conf;
. Adăugați o nouă secțiune:
location /webstats/ {
alias /usr/share/awstats/wwwroot/;
location ~ /cgi-bin/(.+\.pl) {
include fastcgi.conf;
fastcgi_pass php-fpm;
fastcgi_split_path_info ^/webstats/(.+\.pl)(.*)$;
fastcgi_param SCRIPT_FILENAME /usr/share/awstats/tools/nginx/awstats-fcgi.php;
fastcgi_param X_SCRIPT_FILENAME /usr/share/awstats/wwwroot/$fastcgi_script_name;
fastcgi_param X_SCRIPT_NAME $fastcgi_script_name;
}
}
Această secțiune spune Nginx că, atunci când mergem în webstats
directorul din browserul nostru, ar trebui să servească rădăcina web AWStats, iar dacă cerem un script în cgi-bin
director, ar trebui să-l ruleze.
După editarea fișierului de configurare, trebuie să repornim Nginx:
sudo systemctl restart nginx
Acum deschide browserul și du-te la <your website>/webstats/cgi-bin/awstats.pl?config=<yoursitename>
. Aceasta este pagina principală AWStats pentru site-ul dvs. web. Va arăta oarecum așa:
Asigurați-vă că pagina se încarcă corect și că puteți vedea sigla AWStats în colțul din dreapta sus. Dacă pagina nu se încarcă sau logo-ul lipsește, este posibil să aveți ceva neconfigurat într-un pas anterior - mergeți înapoi și asigurați-vă că toate căile sunt corecte.
Nerespectarea paginii dvs. cu statistici poate duce la lucruri rele, cum ar fi spam-ul de referire . De asemenea, nu doriți ca datele dvs. analitice detaliate să fie expuse întregului Internet.
Vom folosi Nginx pentru a pune o parolă pe pagina cu statistici. Deschideți /etc/nginx/nginx.conf
din nou, reveniți la secțiunea adăugată și adăugați următoarele linii sub location /webstats/ {
:
auth_basic "Username and password required to access AWStats";
auth_basic_user_file /etc/nginx/.htpasswd;
Acum trebuie să creăm acel .htpasswd
fișier. Ieșiți din fișierul de configurare și executați următoarea comandă:
sudo htpasswd -c /etc/nginx/.htpasswd <username>
Numele de utilizator poate fi cea mai mare parte nimic, dar nu trebuie să conțină spații și ar trebui să fie unic, nu ceva ușor de ghicit cum ar fi admin
sau webmaster
. Când executați comanda, vi se va solicita o parolă. Introduceți o parolă sigură, apoi confirmați-o.
Reîncărcați Nginx:
sudo systemctl restart nginx
Încercați să accesați din nou AWStats. De data aceasta, vi se va cere numele de utilizator și parola. Introduceți-le și veți fi trimis pe pagina principală AWStats ca înainte.
În cele din urmă, avem nevoie de statisticile noastre pentru actualizare. Vom folosi cron
pentru asta. Este un utilitar de programare a sarcinilor și este preinstalat pe Fedora (și în majoritatea distribuțiilor Linux). Îl vom rula pe AWStats în fiecare zi la miezul nopții. Editați /etc/crontab
și adăugați următoarea linie în partea de jos:
0 0 * * * nginx /usr/share/awstats/wwwroot/cgi-bin/awstats.pl -config=<yoursitename>
Pentru a evita pierderea datelor, vom dori, de asemenea, ca AWStats să fie difuzate atunci când jurnalele sunt rotite. Pentru a face acest lucru, editați /etc/logrotate.d/nginx
. Deasupra postrotate
secțiunii, adăugați următoarele:
prerotate
/usr/share/awstats/wwwroot/cgi-bin/awstats.pl -config=<yoursitename>
endscript
AWStats este acum configurat și gata de plecare.
O perspectivă asupra a 26 de tehnici de analiză a datelor mari: partea 1
Mulți dintre voi cunoașteți Switch care va fi lansat în martie 2017 și noile sale funcții. Pentru cei care nu știu, am pregătit o listă de funcții care fac din „Switch” un „gadget obligatoriu”.
Aștepți ca giganții tehnologiei să-și îndeplinească promisiunile? vezi ce a ramas nelivrat.
Citiți blogul pentru a cunoaște diferitele straturi din Arhitectura Big Data și funcționalitățile acestora în cel mai simplu mod.
Citiți asta pentru a afla cum devine populară inteligența artificială în rândul companiilor la scară mică și cum crește probabilitățile de a le face să crească și de a le oferi concurenților avantaje.
CAPTCHA a devenit destul de dificil de rezolvat pentru utilizatori în ultimii ani. Va fi capabil să rămână eficient în detectarea spam-ului și a botului în viitor?
Pe măsură ce Știința Evoluează într-un ritm rapid, preluând multe dintre eforturile noastre, crește și riscurile de a ne supune unei Singularități inexplicabile. Citiți, ce ar putea însemna singularitatea pentru noi.
Ce este telemedicina, îngrijirea medicală la distanță și impactul acesteia asupra generației viitoare? Este un loc bun sau nu în situația de pandemie? Citiți blogul pentru a găsi o vedere!
Poate ați auzit că hackerii câștigă mulți bani, dar v-ați întrebat vreodată cum câștigă acești bani? sa discutam.
Recent, Apple a lansat macOS Catalina 10.15.4 o actualizare suplimentară pentru a remedia problemele, dar se pare că actualizarea provoacă mai multe probleme care duc la blocarea mașinilor Mac. Citiți acest articol pentru a afla mai multe