Pereiti prie turinio

Vikipedija:Alternatyvios statistikos įranga

Puslapis iš Vikipedijos, laisvosios enciklopedijos.

Alternatyvios statistikos generavimui naudojama specialiai Vikipedijai sukurta programinė įranga. Šiame puslapyje aparšomos kai kurios techninės detalės, leidžiančios geriau suprasti kokiu principu statistika yra generuojama. Puslapio tikslai - išsklaidyti kai kuriuos neaiškumus, kad būtų lengviau pasiūlyti statistikos tobulinimo kelius.

Šiuo metu naudojama nauja, modernesnė įrangos versija, veikianti iš komandinės eilutės ir pritaikyta ne tik Windows operacinėms sistemoms bei SQL Server duomenų bazėms (testuota ir su Mac OS X MySQL 5.0). Visa programa parašyta C# kalba. Įranga sėkmingai ištraukia straipsnius iš Vikipedijos ir sugeneruoja visus statistikos straipsnius bei automatiškai atnaujina juos Vikipedijoje.

Norintys išbandyti ar patobulinti įrangą ar panaudoti tam tikras dalis savo kuriamai įrangai, gali rasti SourceForge projektą, prie kurio tolesnio kūrimo ir tobulinimo gali prisijugti visi norintys.

Anksčiau naudota programinė įranga

[redaguoti vikitekstą]
Anksčiau naudotos PĮ vaizdas

Visa programa parašyta C# kalba, testuota tik su Windows 2003 operacine sistema, programos veikimui būtina MS SQL Server duomenų bazė (turėtų veikti ir su MSDE).

Pagrindiniai moduliai:

  • „Siurbikas“ - skirtas atnaujinti lokalią versiją iš Vikipedijos importuojant pasikeitusius bei naujus straipsnius (XML formatu). Šiam moduliui nereikalinga duomenų bazė - straipsniai XML formatu dedami į atskirus failus specialioje direktorijoje. Pirmą kartą siunčiasi visus failus (iš pagrindinės, kategorijų ir šablonų vardų erdvių), vėliau galima siųstis tik skirtumus.
  • „Statistika“ - pagrindinis modulis, kuris gali:
    • sugeneruoti bazę iš „siurbiko“ sukurtų XML failų. Duomenų bazėje saugomas „išskleistas“ turinys (įtraukiami šablonai, išmesti komentarai), pažymimos tam tikros žymės (ar rastas paveikslėlis, ar redirect, ar yra interwiki, ar priskirta kategorijai), taip pat duomenų bazėje saugomos visos neišskleistame tekste rastos nuorodos.
    • generuoti statistikos puslapių tekstą
  • „Metų straipsnių generatorius“ - pagalbinis modulis generuoti metų ir dešimtmečių straipsnių šablonus
  • Kiti pagalbiniai (beveik nenaudojami) moduliai