Wikipedista:Juandev/Projekty/Diplomky

Z Wikipedie, otevřené encyklopedie

Účelem této tabulky je vytvářet náměty na výzkum (vývoj) Wikipedie a projektů Wikimedia, které by mohly být realizovány studenty vysokých škol a univerzit. Tabulka také nabízí informace o tom, kdo z wiki danému tématu rozumí (a může být nápomocen), kdo a jaká škola dané téma řeší. V neposlední řadě budou uvedeny nějakým způsobem odkazy na výsledky.

Pro Wikipedisty: navrhujte nová témata, upřesňujte názvy a popisy námětů.

Pro pedagogy a studenty: dejte nám vědět, pokud budete řešit něco z níže uvedeného, využijte kontaktů uvedených v tabulce, napište si o více informací: jan.lochman at wikimedia.cz.

Přehled témat pro semestrální, bakalářské a diplomové práce týkající se projektů Wikimedia
Č. Název Popis Obor Wikiprojekt Wikikontakt Řešitel Škola/Ústav Výsledky
1 Aplikace pro naučnou stezku Wikipedie se prezentuje různými způsoby. Pokud se jedná o prezentaci v terénu, jedná se o umísťování QRkódů na památky. Jiným způsobem je nabídnutí obsahu Wikipedie na základě zjištění souřadnic mobilu. S tím souvisí i nápad vytvořit naučné online stezky pro děti a dospělé s využitím dat z Wikipedie a projektů Wikimedia. Jediné, co chybí, je chytrá mobilní aplikace, která by to umožnila. Vzorem může být například aplikace Triphood. IT wp Juandev nabídnuto
2 Sociální datamining na Wikipedii V poslední době se stále často dělají projekty, které pracují se současnou editorskou komunitou Wikipedie. Bohužel nevznikl zvyk se kategorizovat podle bydliště, vzdělání, práce či zájmů. Řada editorů to uvádí jen v textu na uživatelské stránce. Zde bychom ocenili nějaké robotické zpracování, které by vyjíždělo seznamy editorů podle různých předem definovaných parametrů. IT wp nabídnuto
3 Upřesnění souřadnice českých vesnic Všechny české vesnice a obce mají na české Wikipedii článek. Všechny též mají své geografické souřadnice. Tyto souřadnice jsou ale chybné. V různých bázích jsou dostupné správné souřadnice, které zobrazují střed vsi. Bylo by potřeba převést tyto souřadnice a nahradit ty špatné na české Wikipedii. IT wp nabídnuto
4 Generátor metadat Zpracování fotek pro Wikipedii není jen o pouhém nahrávání ale i o jisté dokumentační činnosti. Každá fotografie, potažmo soubor, se musí patřičně pojmenovat, musí se k ní uvést detailní popis česky a případně anglicky, musí se vložit do kategorií, přičemž informace obsažené v těchto třech skupinách jsou hodně podobné. Například fotografie stodoly z Horní Dolní:
  • ponese název Horní Dolní, stodola.jpg
  • bude popsána jako Stodola v Horní Dolní, okres Pelhřimov, Česká republikaa/nebo anglicky Barn in Horní Dolní, Pelhřimov District, Czech Republic.
  • bude v kategoriích Horní Dolní a Barns in Pelhřimov District

Požadavek je navrhnout systém a vyvinout sw, který by minimalizoval práci editora. Takový sw by měl buď fungovat jako doplněk sw VicunaUploader, nebo jako uživatelský JavaScript či projektové udělátko.

IT c nabídnuto
5 Prohledávání Wikimedia Commons a grafický výstup Dnes obsahuje úložiště Wikimedia Commons skoro 30 milionů volně užitelných souborů. Řada z nich je velmi podrobně kategorizována, přesto jsou určitým způsobem nedobytné, protože neexistují nástroje, kde by se dalo filtrovat na základě více parametrů (například “zobraz fotografie určitého uživatele v období červen až srpen 2013 v kategorii a subkategoriích Španělsko“). Zde by bylo dobré takový nástroj naprogramovat nebo vytvořit doplňky k již existujícím nástrojům. IT c nabídnuto
6 Filtr nekvalitních a nesouvisejících fotografií Byť existuje mobilní aplikace pro nahrávání fotek do mediálního úložiště WikimediaCommons, není k dispozici, protože za jeho provozu se neúměrně zvýšil počet technicky nekvalitních fotografií a fotografií, které se nedají použít k ilustraci projektů Wikimedia (selfie). Je tedy potřeba vyvinout systém, jak moci používat tuto či jiné podobné aplikace a zároveň jednoduše odfiltrovat nekvalitní a nesouvisející fotografie. IT c nabídnuto
7 Automatický překlad kategorií V současné době je možné na mediálním úložišti Wikipedie Wikimedia Commons používat v rozhraní jakýkoliv jazyk. Co však možné neníje zařazování médií do kategorií s mateřskými názvy, v tomto případě v češtině. Obrázky a jiné soubory jsou na tomto depozitáři pouze v angličtině, což je velkou překážkou pro ty, kteří tímto jazykem nehovoří. Požadavek je na navržení nezávislého systému či sw, který by umožňoval zadávání kategorií v češtině a následnou automatickou translaci do existujících kategorií v angličtině - či generování takových kategorií z jiných dodaných metadat. IT c nabídnuto
8 Mobilní aplikace pro nahrávání fotografií Chybí mobilní aplikace pro nahrávání fotek, která by podle dat z GPS automaticky dodávala kategorie a popisky k souborům (fotkám). Související téma: 6) Filtr nekvalitních a nesouvisejících fotografií. IT c Aktron nabídnuto
9 Upgrade VicunaUploaderu VicunaUploader je javový software určený pro nahrávání zejména fotografií do úložiště wikipedistických médií nazvaných WikimediaCommons. Dají se s ním také nahrávat i jiná média do jiných projektů na sw MediaWiki. Navrhovaný upgrade by měl zahrnovat vyřešení a implementování následujících požadavků, které vznikly z častého používání tohoto sw:
  • v mapové části nabídnout satelitní mapu
  • pokud možno nabídnout offline turistické mapy, které jsou dostupné, např. na mapy.cz
  • přidat funkci určení směru fotografování a vytvoření patřičné WCommons šablony
  • nabídnout alternativní pole (nastavitelné uživatelsky) provkládání dalších souřadnic (např. objektu) či jakýchkoliv dalších šablon, kteréby neměly být v metadatové položce Popis
  • možnost editovat cílový projekt pro upload
  • nabídnout možnost vypnutí dropdown nápovědy kategorií
  • načíst data z datové vrstvy videa (například datum focení) - formát Ogg Theora
  • umožnit zadání všech znaků do cílové galerie
  • umožnit vyjmout fyzicky soubor z připravovaného seznamu souborů
  • vytvořit ikonu sw
  • funkce volby určitého adresáře pro různé operační systémy
IT c nabídnuto
10 Integrace popisu souborů do Translatewiki Popis souborů je jedním ze součástí metadat popisující soubory na Wikimedia Commons. Často se uvádí česky, anglicky a v dalších jazycích. Editování je ale dosti náročné, protože je potřeba několikrát kliknout a editovat ve wikikódu. Značným zrychlením a zjednodušením by bylo integrovat překlady do projekt translatewiki.net, nebo integrovat translatewiki.net jako uživatelský nástroj na Wikimedia Commons. IT c nabídnuto
11 Úprava videa a převod do Ogg Theora online Jedním z ilustračních prvků Wikipedie jsou videa. Bohužel depozitář Wikimedia Commons akceptuje pouze dva formáty: Ogg Theora a WebM. Navíc pro operační systém Windows neexistuje moc open source pro zpracování a převod formátu videa. V tomto případě by bylo potřeba vyvinout buď sw - nebo online aplikaci, který umožní základní úpravy videa, jako je otočení, ořez stopy, vložení titulků či míchání a zároveň převede do patřičného formátu. IT c nabídnuto
12 Úprava fotek online V současnosti je již možné s použitím nástrojů otáčet fotografie a dělat výřezy přímo u fotek uložených na Wikimedia Commons. Bylo by ale dobré umožnit dělat i další funkce, jako jsou koláže více fotek či rozmazávání (např. SPZetek) apod. IT c nabídnuto
13 Generátor příbuzných slovíček Nástroj, který by ve Wikiverzitě generoval příbuzná slova a jejich překlady v určitém cizím jazyce z Wikislovníku. Příbuznost by měla být předmětná (zvířata, rostliny apod.). IT wv nabídnuto
14 Jednoduchý memorizační nástroj Na Wikiverzitě v současnosti chybí jednoduchý memorizační nástroj, který by umožňoval učit se slovíčka, poznávat rostliny apod. Optimální řešení: formou extenze do sw MediaWiki. IT wv nabídnuto
15 Testovací nástroj s ukládáním dat, skrytými výsledky a vyhodnocením Wikiverzita se zároveň zaměřuje na e-learning. V současnosti má k dispozici rozšíření Quiz, které je navrženo jako zkoušecí nástroj, ale vzhledem k tomu, že zobrazuje výsledky, ale neukládá je, používá se spíše jako nástroj memorizační. Zde by bylo třeba vyvinout nástroj, který by nezobrazoval výsledky, ale dataukládal a poskytoval jak studentům, tak vyučujícímu zpětnou vazbu. IT wv nabídnuto
16 Interaktivní proklikávací prostředí Ideálním způsobem, jak učit děti nějakému tématu, je používat interaktivní proklikávací obrázky. Kliknou na objekt na obrázku a něco se o něm dozvědí. Po čase, pokud chtějí jít dál, dostanou sérii otázek - pokud je nezodpoví správně, jsou navráceni zpátky do systému. Testováno na Wikiverzitě pod názvem Sluneční soustava. Řešení formou rozšíření sw MW nebo mobilní aplikací. IT wv nabídnuto
17 Skiny pro přednášky Wikiverzita umožňuje umísťovat do svých stránek stránky s přednáškami. Každá přednáška má 2 verze zobrazení. Jedna klasická pro čtení, druhá se zjednodušeným CSS pro prezentování na plátně. V rámci rozšíření používání tohoto nástroje by komunita ráda nabídla několik různých módů (skinů) pro přednášející. IT wv nabídnuto
18 Záznam výslovnosti Wikislovník je sesterský projekt Wikipedie jehož cílem být největším výkladovým a překladovým otevřeným slovníkem světa. Jedna z věcí, které ale chybí, jsou záznamy výslovnosti rodilými mluvčími. Wiki projekty jsou postaveny na myšlence: chybí informace - přidej ji. A tak by to mohlo fungovat i s výslovností. Ideálním řešením by bylo mít u každého slova tlačítko „Nahraj“ a umožnit tak registrovaným uživatelům výslovnost nahrávat. IT wikt, c nabídnuto
19 Zpracování výslovnosti Editoři nahrávající výslovnost slov pro otevřený Wikislovník často nahrají sekvenci slov, kterou pak musí rozdělit do jednotlivých souborů. Zde by se hodilo vytvořit systém a software, který by tuto činnost zautomatizoval, případně mobilní aplikaci, která by například stáhla seznam slov bez výslovnosti a nabízela slova k záznamu. Soubory by se pak nahrály na úložiště médií a přidali do stránek Wikislovníku. IT wikt, c nabídnuto
20 Možnost použití tabletů pro focení ilustračních fotografií pro Wikipedii Tablety a mobilní zařízení jsou stále více a více využívány. Ze sledování, které máme k dispozici víme, že prudce stoupá návštěvnost Wikipedie z mobilních zařízení. V České republice je realizováno několik projektů, které mají za cíl přinést tablety učitelům. Je pravděpodobné, že v budoucnu se tyto projekty rozšíří o "tablety žákům". Cílem práce je zjistit, jak složité je pořizovat fotografie tabletem. Zdali je kvalita fotografií dostatečná, jak složité je nahrávání a jaká úskalí může toto rozšíření či cílená aktivita přinést. IT, foto wp, c nabídnuto
21 České digitální fulltextové knihovny, postavení Wikizdrojů V posledních letech se stala oblíbenou, ale i potřebnou digitalizace fondů, digitalizace starých tisků. Existují stovky stránek či projektů škol, univerzit, ústavů, knihoven a archivů, které nabízejí zdigitalizované fondy. V mnoha případech se jedná o pouhé skeny. Jen v několika případech se jedná o strojově čitelné přepisy. Cílem práce je zmapovat volně dostupné digitální knihovny, které obsahují právě strojově čitelné texty, popsat je a uvést jaké postavení mezi nimi zastává projekt Wikizdroje. archivářství ws, ostatní nabídnuto
22 Marketing projektu Wikizdroje Wikizdroje (anglicky Wikisource) je sesterský projekt Wikipedie, který šíři digitálně přepisy již vydaných tiskovin pod svobodnou licencí. Cílem práce je zjistit stav tohoto projektu, jeho nabídku a navrhnout způsoby marketingu. marketing ws
23 Zdroje dat pro automatické přebírání tiskovin do Wikizdrojů Wikizdroje (anglicky Wikisource) je sesterský projekt Wikipedie, který šíři digitálně přepisy již vydaných tiskovin pod svobodnou licencí. Česká verze v současnosti neobsahuje příliš mnoho stran, protože se projektu věnuje málo dobrovolníků. Cílem práce je prozkoumat elektronické databáze tiskovin a určit, jestli licence a technické prostředky umožňují jejich převzetí. právo, IT ws nabídnuto
24 České digitální otevřené učebnice, postavení Wikiknih

žijeme v digitální době Internetu, tištěné učebnice stále dominují. Přesto se objevují první perličky v podobě možnosti zakoupení zdigitalizovaného skenu jinak tištěné prodávané učebnice. Cílem této práce je ale mapovat digitální učebnice, které jsou šířené pod otevřenou/svobodnou licencí a porovnat tyto projekty s projektem Wikiknihy.

pedagogika,

knihovnictví

wb nabídnuto
25 Knihovníci a Wikipedie Wikipedie je největší digitální encyklopedií světa. Česká Wikipedie má kolem 70 milionů shlédnutí za měsíc. Cílem práce je udělat průzkum mezi knihovníky a zjistit, jaká je jejich povědomost o Wikipedii: doporučují Wikipedii čtenářům?, jak?, zpřístupňují wikipedii čtenářům?, znají její historii?, vědí jak wp vzniká? sami editují? umí čtenářům vysvětlit jak ji používat? rozmějí licencím? vědí jak wp přebírat? apod. knihovnictví, statistika wp nabídnuto
26 Využití Wikipedie při studiu Wikipedie je největší digitální encyklopedií světa. Česká má v současnosti přes 300 000 encyklopedických hesel, anglická necelých 5 milionů. Cílem práce je zjistit, jakým způsobem žáci a studenti na různých stupních vzdělávání využívají Wikipedii ke studiu.+statistika pedagogika, stats wp
27 Využití Wikipedie ve výuce Wikipedie je největší digitální encyklopedií světa. Česká má v současnosti přes 300 000 encyklopedických hesel, anglická necelých 5 milionů. Někteří učitelé Wikipedii svým studentům zakazují, jiní ji sami používají ve výuce. Cílem je zjistit jakými způsoby je Wikipedie využívána ve výuce na českých školách. pedagogika, statistika wp nabídnuto
28 Špatná převzetí obsahu Wikipedie Wikipedie

je největší digitální encyklopedií světa. Česká má v současnosti přes 300 000 encyklopedických hesel, anglická necelých 5 milionů. Wikipedii doplňuje 30 milionů médií, hlavně fotografií. Obsah je šířen pod svobodnou/otevřenou licencí, tedy způsobem který klade minimum bariér pro užívání díla. Většinou je potřeba uvést pouze autora/y a šířit pod stejnou licencí. Hodně převzetí, ale licenčním ujednáním nevyhoví. Je uváděn zdroj, nikoliv autoři. Autorem bývá označována Wikipedii, nebo Wikimedia Commons, licence nebývá uvedena apod. Cílem této práce je zmapovat špatná převzetí Wikipedie, případně nalézt důvody k tomu vedoucí.

právo, žurnalistika, statistika wp nabídnuto
29 Otevřené vzdělávání v pojetí Wikiverzity Wikiverzita je sesterský projekt Wikipedie. Zaměřuje se na otevřené vzdělávání a výzkum pro všechny věkové kategorie. Cílem je zmapovat a popsat realizaci otevřeného vzdělávání na tomto projektu. pedagogika, e-learning wv nabídnuto
30 Motivační typologie editorů Wikipedie Wikipedie je největší digitální encyklopedií světa. Česká má v současnosti přes 300 000 encyklopedických hesel, anglická necelých 5 milionů. Na počátku to byl pouze pokus, pokus, jestli dobrovolníci něco vytvoří, nebo projekt zanikne. Projekt však předčil očekávání zakladatelů a počet článků začal prudce narůstat. Editoři Wikipedie jsou neplacení dobrovolníci. Cílem této práce je zjistit, jaké jsou motivy lidí vkládajících informace a média do Wikipedii a typologicky je zařadit - tedy jestli dominují lidé určitého typu motivace. Co takovým lidem vyhovuje či co je na Wikipedii přitahuje. psychologie, statistika wp
31 Typologie vzdělávacích jednotek Wikiverzity Wikiverzita je sesterský projekt Wikipedie. Zaměřuje se na otevřené vzdělávání a výzkum pro všechny věkové kategorie. Česká Wikiverzita již existuje od roku 2007. Za tu dobu na ní vzniklo mnoho rozličných stránek různých typů (kurzy, databáze, přednášky, cvičení apod.). Cílem práce je prozkoumat diverzitu obsahu Wikiverzity a zmapovat její obsah a podle různých hledisek roztřídit. pedagogika, e-learning wv nabídnuto
32 Vazby mezi stránkami projektů Wikimedia Projekty

Wikimedia jsou skupinou projektů zpřístupňujících lidské znalosti. Nejznámějším je projekt Wikipedie, projekt svobodné encyklopedie. Projekty Wikimedia používají software MediaWiki, který je primárně vyvíjen pro potřeby encyklopedie Wikipedia a pro ostatní potřeby - projekty - je dolaďován rozšířeními. Různé projekty zpřístupňují znalosti různou formou. Wikipedie encyklopedickými články a seznamy, Wikiknihy a Wikizdroje digitálními knihami; Wikidata metadata o sémantických položkách. Cílem této práce je prozkoumat stránky a vazby mezi stránkami v rámci jednotlivých typů prezentace otevřeného vědění na projektech Wikimedia a to, jak se jednotlivé projekty těmto požadavkům přizpůsobují.

informatika projekty Wikimedia nabídnuto
33 Komunitní a individuální nástroje na projektech Wikimedia informatika, IT
34 Editoři české Wikipedie Wikipedie je největší digitální encyklopedií světa. Počet aktivních editorů české Wikipedie, kteří učiní 100 a více editací za měsíc se pohybuje mezi 70 a 100. Těch co vytvoří minimálně 5 editací za měsíc bývá v různých měsících 500-700. Cílem této práce je zjistit, kdo jsou tito editoři. Typická data mohou odhalit poměr pohlaví; počet studentů, zaměstnaných; věk; úroveň vzdělání; obor; apod. sociologie, psychologie, statistika wp
35 Hodnocení kvality obsahu, pokles počtu nejkvalitnějších hesel Wikipedie je největší digitální encyklopedií světa. Česká má v současnosti přes 300 000 encyklopedických hesel, anglická necelých 5 milionů. Vedle počtu hesel, je důležitá i jejich kvalita. Editoři Wikipedie si k tomu vytvořili i hodnotící hlediska. Někdy se články rozdělují podle kvality (od nejhorší): subpahýly (většinou se maží), pahýly, články, dobrá hesla a nejlepší hesla. Česká Wikipedie má v současnosti asi 145 nejlepších hesel s tím, že jejich nárůst se zpomaluje. Cílem této práce je popsat hodnocení kvality hesel, jeho vývoj a nalést důvody poklesu nárůstu Nejlepších hesel. psychologie,

statistika,

kvalita

wp
36 Nástroj na opravu odkazů Editování Wikipedie a sesterských projektů je dnes již jednodušší díky VisualEditoru (WYSIWYG). Přesto nějkteré záležitosti jsou pracné. Jednou z takových záležitostí je přejmenování stránky. Samotné přejmenování je jednoduché - existuje na to funkce/tlačítko - následně je ale potřeba buď ručně, nebo roboticky (Python) nasměrovat všechny odkazy (linky) na nový název stránky. V případě ručního provedení je to zdlouhavé a otravné, v případě robotického, musí existovat ochotný botovodič. Ideální by bylo mít uživatelsky jednoduchý online nástroj, který by tyto úpravy prováděl. IT vše
37 Identifikace neurčených rostlin z fotografií biologie, botanika c
38 Identifikace neurčených fotografií zvířat biologie, zoologie c
39 Identifikace erbů z fotografií heraldika c
40 Automatické generování citačního klíče dle ISBN Na anglické Wikipedii funguje nástroj pro automatické generování citačního klíče dle ISBN či DOI. Stejně by to v rámci VisualEditoru mohlo fungovat i na cs. IT wp
41 Zpracování nápovědy pro TemplateData TemplateData je editační nástroj šablon, který umožní editovat TD šablon. Pokud má šablona vloženy TD je možné je vyplňovat jednodušeji ve VisualEditoru. Kvalita zpracování TD pak je rovna kvalitě editování šablon ve VE. Aktuálně však české Wikipedie má vloženy TD jen v některých šablonách, v některých dokonce špatně, což znemožňuje pohodlné editování. Chybí též nápověda jak s TD pracovat. Cílem této práce by mělo být zpracovat odpovídající nápovědu (text/obrázky nebo video). IT, pedagogika wp