2 mai 2017

Modul confidențial

De curând am lansat la dexonline o funcție pe care noi o considerăm importantă: modul confidențial.

Ce este modul confidențial?

În mod normal, paginile dexonline încarcă și elemente de pe alte servere, mai exact:

  • caseta de Facebook;
  • scriptul Google Analytics, pe care îl folosim pentru a calcula statistici despre numărul de vizitatori ai dexonline;
  • bannerul publicitar, servit prin Google AdSense sau prin alți furnizori;
  • fonturile încărcate de la Google Fonts.

Dacă activați modul confidențial, paginile dexonline nu mai încarcă elemente de pe alte servere; comunicația se petrece strict între dumneavoastră și serverul dexonline. În plus, deoarece conexiunea este securizată prin HTTPS, nimeni altcineva nu știe ce pagini ați vizitat în cadrul dexonline.

Cum activez modul confidențial?

Modul confidențial este disponibil, timp de un an, utilizatorilor care

  • au donat cel puțin 50 de lei;
  • au un cont pe dexonline.

Concret, puteți activa și dezactiva modul confidențial din pagina de preferințe (după ce ați intrat în contul dumneavoastră). În caseta „Preferințe”, ultima pe listă este cea pentru modul confidențial.

Dacă folosiți dexonline de pe mai multe dispozitive, preferința setată mai sus se aplică tuturor dispozitivelor, dar este nevoie să intrați în cont pe fiecare dispozitiv.

Am lansat definițiile structurate

La dexonline am sărbătorit Ziua Muncii prin muncă (știm, suntem niște dubioși). Astfel că, în weekendul trecut, am lansat o funcție pe care o pregătim de mai bine de un an: definițiile structurate. Vedeți, de exemplu, abate sau talpă, unde am evidențiat separat sensurile, subsensurile, expresiile, exemplele, sinonimele, etimologia etc. Comparați aceasta cu formatul din dicționar (de exemplu pentru talpă), unde aceste informații sunt listate de-a valma.

Structurarea definițiilor are trei componente, din care primele două sunt aproape încheiate:

  1. Programarea sistemului pentru a afișa definițiile în acest format, precum și găsirea unei reprezentări coerente și complete în baza de date a acestor informații.
  2. Redactarea unui Ghid pentru structurare, care tratează diversele categorii de probleme apărute la structurare, astfel încât persoanele implicate în acest efort să poată structura definițiile într-o manieră consecventă.
  3. Parcurgerea efectivă a celor peste 200.000 de intrări din dexonline și structurarea lor.
Până acum am structurat aproape 3.000 de intrări (cam 1,5%), deci nu sunt șanse foarte mari să dați peste ele folosind site-ul în mod uzual. Desigur, în timp acest număr va crește!

Colegul nostru Matei, expertul de facto în domeniu, ocupându-se aproape exclusiv de structurare în ultimul an, a ajuns la un ritm mediu de circa 10 minute pentru structurarea unei intrări. Așadar, estimăm că structurarea tuturor intrărilor va dura peste 33.000 de ore, adică peste 17 ani-om (cu normă întreagă). Și asta presupunând că lexicografii se vor opri din produs dicționare și ediții noi în acest timp. :-)

Bineînțeles, sperăm să atragem și alți colaboratori interesați de proiect. Rămâne problema costului, care nu este neglijabil. Alegeți-vă un tarif rezonabil pe oră, înmulțiți-l cu 33.000 și veți afla costul structurării tuturor definițiilor. :-) Dacă doriți, puteți dona ca să contribuiți la acest efort și la alte proiecte ale dexonline.

13 martie 2017

Zăresc pretutindeni felonii

Anul trecut am observat că lumea a căutat frenetic pe dexonline răspunsuri la o întrebare din examenul de simulare pentru examenele naționale de la clasa a 8-a. În mod curios, căutările au venit... în timpul examenului, iar câteva chiar înainte de începerea lui!

Lăsăm la o parte stupizenia unor oameni de a trișa la un examen de antrenament. Anul trecut am observat tardiv autofurarea căciulii, dar anul acesta am apucat să ne organizăm nițel. :-)

Pe durata simulărilor de astăzi, am înlocuit definițiile pentru cuvintele date la subiecte, astfel:
  • pretutindenea, pretutindeni → pururi;
  • a zări, zărit →a zori, zorit;
  • felonie → făloșenie (mai mult despre asta la final).
Deci definițiile prezentate arătau cam așa:

Am dedus aceste cuvinte înainte să apucăm să vedem subiectele, urmărind pur și simplu lista cu cele mai căutate cuvinte, în care acestea se detașau clar. Iar statisticile confirmă că nu ne-am pregătit degeaba! Pentru pretutindeni / pretutindenea și a zări / zărit, căutările au fost distribuite astfel:
  • de la 08:00 la 08:59 au fost 9 căutări;
  • de la 09:00 la 09:59 au fost 143 de căutări;
  • de la 10:00 la 10:59 au fost 171 căutări;
  • de la 11:00 la 11:59 au fost 989 căutări.

Acum așteptăm cu interes rezultatele examenelor. >:-)

În încheiere, două vorbe despre felonie. Tot înainte de 09:00 dimineața, am observat o creștere a interesului pentru acest cuvânt, care a avut 35 de căutări înainte de 09:00. Am presupus că este și el parte din subiecte, așa că i-am „deturnat” și lui definițiile. Între 09:00 și 12:00, cuvântul a mai adunat 335 de căutări. Totuși, nu l-am regăsit nicăieri în enunțul subiectelor!

După amiază, am lămurit și misterul: domnul Andrei Pleșu publicase pe blogul său, chiar azi-dimineață, un articol în care folosea acest cuvânt. Nefericită coincidență!

Îi mulțumim lui David pentru ajutorul dat la implementare. Vă reamintim pe această cale că dexonline este software liber și oricine dorește poate programa pentru noi. Oferim la schimb recunoștință și momente hilare ca acesta. Și, ocazional, tricouri.

Ne revedem la examenele reale!

22 decembrie 2016

Definiții structurate - un exemplu

Structurarea definițiilor ne duce de la


la


Mai avem mult de lucru până să fie gata. Nu în ultimul rând, mai avem de lucru la prezentarea vizuală a diferitelor componente, la adăugarea de exemple și la reconcilierea diferendelor între dicționare asupra anumitor sensuri. Dar, dacă avem ceva, de 15 ani încoace, este muuuultă răbdare. :-)

14 noiembrie 2016

Structurarea definițiilor

În prezent, definițiile din dexonline sunt stocate ca simple bucăți de text, cu marcaje pentru text aldin, italic sau alte formatări. De exemplu, definiția pentru föhn:
FÖHN, (2) föhnuri, s. n. 1. Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. 2. Uscător electric pentru păr. [Pr.: fön] – Din fr. foehn, germ. Föhn.
este reprezentată, în baza noastră de date, ca:
@FÖHN,@ (@2@) $föhnuri,$ #s. n.# @1.@ Vânt cald, uscat și puternic, care bate primăvara dinspre crestele alpine ale munților din Elveția și Austria spre văi, grăbind topirea zăpezilor. @2.@ Uscător electric pentru păr. [#Pr.#: $fön$] - Din #fr.# @foehn,@ #germ.# @Föhn.@
Structurarea implică și ierarhizarea sensurilor
Acest format este simplu de folosit, dar are un dezavantaj. Componentele definiției sunt toate de-a valma: sensurile, subsensurile, pronunția, silabisirea, morfologia (conjugările de verbe și declinările de substantive), etimologia (originea cuvântului) etc. Lipsa structurării limitează utilitatea bazei noastre de date, căci unele analize sunt greu sau imposibil de făcut. De exemplu, nu este ușor să găsim toate cuvintele care se pronunță altfel decât se scriu, sau toate cuvintele care provin din limba germană.

De aceea, am demarat (de ceva vreme) un efort de structurare a definițiilor, adică de separare și clasificare a tuturor proprietăților sus-menționate. Nu știm sigur cât va dura acest efort; probabil câțiva ani. Nouă ni se pare un proiect foarte interesant. Poate și vouă? În orice caz, vă vom ține la curent ocazional cu evoluția procesului de structurare.

Pentru astăzi, etichetele pe cuvinte. Unele informații sunt relativ ușor de extras automat. Majoritatea verbelor din dexonline sunt acum etichetate cu informații despre grupă și conjugare:

  • a onora este verb de grupa I, conjugarea a II-a;
  • a părea este verb de grupa a II-a, conjugarea a VIII-a.
Am procedat similar și pentru alte părți de vorbire (cu oarece erori):
  • muncitor este adjectiv sau substantiv masculin și feminin;
  • aferim este interjecție.
În timp, vom adăuga și alte etichete de interes pe cuvinte, în special cele din registrul stilistic (familiar, popular, ironic ș.a.m.d.). De exemplu, zbenghi este un substantiv familiar și popular.

15 septembrie 2016

Rezultatele chestionarului pentru noul design dexonline

Acum două săptămâni (30 august 2016) lansam primul chestionar organizat pentru dexonline, menit să strângă părerile utilizatorilor despre noul design, lansat în luna august.

Rezultatele pe scurt


1. Ce părere ai despre noul design dexonline.ro?



2. Ce îți place la noul design dexonline.ro?
Întrebare deschisă, la care cele mai comune răspunsuri au fost:
  • simplitatea
  • aspectul mai modern, adaptat smartphone-urilor
  • interfața mai aerisită
  • fonturile mai mari, mai ușor de citit
3. Ce îți displace la noul design dexonline.ro?
Întrebare deschisă, la care cele mai comune răspunsuri au fost:
  • banner-ul și dimensiunea acestuia*
  • bara de căutare prea lungă
  • logo-ul dexonline*
  • lățimea prea mare a conținutului paginii, pe desktop
* elemente care existau și înainte pe site (nu țin de noul design), dar participanții au simțit nevoia să profite de această ocazie pentru a-și exprima opinia. Mulțumim pentru sinceritate!

4. Ai recomanda dexonline.ro unui prieten/membru de familie?


5. Ce funcții anume folosești cel mai des pe dexonline.ro? (bifează toate opțiunile care ți se aplică)

Reamintesc că opțiunile disponibile aici erau (în ordinea în care apar și în grafic):
  • căutarea definiției unui cuvânt
  • Cuvântul zilei
  • Cuvântul lunii
  • Cuvânt aleator
  • Jocuri (spânzurătoarea, moara cuvintelor)
  • verificare pentru Scrabble
  • Articolul lunii
  • Articole lingvistice
  • Ghid de exprimare
  • Contribuie cu definiții
  • Informații pentru programatori
6. Dacă ai descoperit vreun bug în noul design, care este acela?
Întrebare opțională, la care au fost semnalate două bug-uri. Promitem să investigăm.

7. Cât de des folosești dexonline.ro?



8. Dacă dorești să participi și la alte studii legate de dexonline.ro, te rugăm lasă-ne adresa ta de e-mail (nu vei fi abonat la newslettere, nu vei primi spam din partea noastră).
Întrebare opțională, la care aproximativ o treime din participanți s-a arătat disponibilă pe viitor.

Ce am învățat din acest chestionar?

În primul rând, am aflat care sunt cele mai folosite funcții de pe dexonline - ele vor avea prioritate la dezvoltare/îmbunătățire pe viitor. Pe de altă parte, rămâne ca temă de studiu pentru viitor de ce restul funcțiilor sunt atât de puțin folosite (prea puțin vizibile în interfață? utilitate scăzută pentru vizitatorul de rând? ar merita "pensionate" o parte din ele? etc).

Am aflat ce elemente le displăceau utilizatorilor și înainte de noul design. O parte dintre ele pot fi schimbate (logo-ul în format SVG, de exemplu), altele (nuanța de roșu, de exemplu) țin de branding-ul dexonline și nu vor fi schimbate în viitorul apropiat (rebranding-ul nu este în plan pentru acest proiect).

Am aflat ce elemente le displac utilizatorilor odată cu trecerea la design responsive (interfață adaptabilă la lățimea disponibilă a ecranului, în funcție de dispozitivul de pe care vizitezi: desktop, tabletă, mobil). Avem de retestat anumite elemente pe ecranele foarte mari (peste 1200px lățime).

Design-ul nou a avut în general un feedback pozitiv, mai exact 76.22% dintre participanți sunt de părere că schimbările sunt binevenite. Deși design-ul actual nu diferă foarte mult de cel anterior (nici nu am dorit o tranziție bruscă), pentru oamenii obișnuiți cu interfețe minimaliste schimbarea a fost evidentă; am renunțat la efectul de umbră pentru multe elemente, am introdus mai mult alb drept culoare de fundal, am spațiat mai bine elementele de pe pagina principală. Mai avem de lucru la pagina definițiilor, unde (și noi) și utilizatorii consideră că e nevoie de mai multă structurare.

Faptul că aproape 3 sferturi dintre utilizatorii noștri folosesc dexonline foarte des (zilnic sau de câteva ori pe săptămână) este dovada că munca noastră nu este în zadar, ci chiar necesară.

Relevanța statistică a acestui chestionar

Pasionații de statistică își vor pune întrebarea: În ce măsură aceste rezultate reprezintă întreaga populație de utilizatori dexonline (peste 2 milioane de vizitatori unici pe lună)?

Noțiuni de statistică folosite:
  • marja de eroare descrie cât de aproape este răspunsul eșantionului folosit de valoarea reală a populației. Cu cât marja de eroare este mai mică, cu atât mai aproape suntem de răspunsul exact care ar fi fost măsurat la nivelul întregii populații. În general, cu cât eșantionul este mai mare, cu atât marja de eroare este mai mică.
  • intervalul de încredere ne spune dacă măsurătoarea noastră este de încredere; un interval de încredere de 95% înseamnă că dorim să fim 95% siguri de rezultate și că acceptăm să fi greșit în 5% din cazuri; dacă am repeta acest chestionar de 100 de ori în aceleași condiții, atunci în 95 chestionare am obține rezultate care se încadrează în marja de eroare aleasă.
În cazul nostru, pentru o populație de fix 2.000.000 utilizatori unici lunari, cu un interval de încredere de 95% și un eșantion de 143 participanți, marja de eroare rezultată este de 9% (calculator aici).

Se putea mai bine, se putea mai rău. Sperăm ca la următorul studiu să reușim să mobilizăm mai mulți participanți.






29 august 2016

dexonline are un nou design


"Good news, everyone!", cum ar spune profesorul Farnsworth din serialul Futurama. dexonline are un nou design, mai modern, începând din august 2016.

Vechiul design data din toamna lui 2011 și avea câteva lipsuri: interfață diferită pe desktop versus mobil, ascunderea multor funcții pe interfețele de mobil datorită ecranului mai mic disponibil, mult CSS personalizat care îngreuna contribuirea cu cod etc. Aceste lipsuri nu mai puteau fi ignorate, mai ales în contextul unui trafic mereu în creștere de pe dispozitive mobile.

Părerea voastră contează

Dacă am putea crea din prima un design perfect, atunci cel mai probabil că ne-am culca pe o ureche și nu am mai dezvolta nimic pe viitor pentru dexonline. Diferența dintre platforma noastră și clonele legale ale dexonline (există mai mult de o duzină) este că noi dezvoltăm în permanență acest proiect, adăugând funcții noi sau îmbunătățindu-le pe cele existente.

Scopul nostru nu este să avem un site „care merge și pe care ai unde posta un banner pentru reclame”, scopul nostru este să contribuim activ și constant la învățarea limbii române, o limbă pentru care există prea puține unelte lingvistice online (spre deosebire de limba engleză, de exemplu).

De aceea părerea voastră, a utilizatorilor dexonline, contează pentru noi.
Dacă doriți să ne împărtășiți părerea voastră despre noul design, vă rugăm accesați următorul chestionar http://bit.ly/2bSiXBd (chestionarul va fi deschis pentru o perioadă limitată de timp).

Ce am urmărit cu noul design?

Pentru utilizatorii de rând:
  • în primul rând, crearea unei singure interfețe, unitare, indiferent de dispozitivul electronic folosit pentru vizitarea dexonline (design responsive); această schimbare aduce cu sine folosirea mai eficientă a ecranului pentru dispozitive medii (tablete) și mici (smartphone-uri), precum și eliminarea barei orizontale de scroll pe anume ecrane (inestetică); 
  • afișarea pe mobil a tuturor funcțiilor prezente pe desktop, în special a jocurilor (cine nu dorește să acceseze de pe mobil un joc, când ai câteva minute de pierdut în trafic sau în alt moment al zilei?); 
  • la capitolul „pagina principală”, vechiul design afișa pe mobil doar „Cuvântul zilei”, ceea ce făcea site-ul mult mai puțin atractiv pentru internauții mobili (al căror număr este în creștere de la un an la altul); 
  • afișarea întregului meniu de navigare (vechiul design oferea o variantă mult redusă a acestuia), foarte utilă pentru utilizatorii noi ai dexonline, care nu cunosc bine proiectul și nici funcțiile oferite de această platformă; 
  • o interfață mai modernă, mai minimalistă, care sperăm să fie și mai ușor de folosit (așteptăm părerea voastră în această privință prin intermediul chestionarului de mai sus). 
Pentru programatori:
  • folosirea Bootstrap, o arhitectură foarte populară de CSS/Javascript care ușurează foarte mult scrierea de cod nou și mentenanța codului existent, asigurând totodată și mai multă consecvență pe partea de frontend; 
  • reducerea volumului de cod personalizat CSS, care de asemenea contribuie la consecvență și ușurință în dezvoltare. 
Mulțumiri și pe această cale voluntarilor care au lucrat la noul design: David Bătrânu, Cătălin Frâncu și Sonia Frâncu.

31 ianuarie 2016

Despre DLRLC și dexonline

    Acest text a fost scris de Laura Gellner, cel mai vechi voluntar al nostru, la rugămintea noastră de a ne spune opinia ei despre ultimul dicționar introdus și finalizat.

    Din anul 2002 ajut la îmbogățirea cu definiții a acestui minunat proiect - dexonline - realizat de un grup de tineri inimoși dar și curajoși, proiect  care acum, după atâția ani a ajuns să fie un instrument de lucru pretutindeni în țară și chiar și peste hotare. Pe atunci dexonline avea cam 25.000 de cuvinte definite, acum acesta are aproape 700.000 și continuă mereu să crească.

    Proiectul a adunat deja și continuă să mai adune numeroase dicționare de prestigiu românești, realizate de-a lungul timpului; a început cu Dicționarul explicativ al limbii române și ultimul dicționar introdus este Dicționarul limbii române literare contemporane (DLRLC) apărut în 1955-1957. Pe mine m-a atras în mod deosebit acest DLRLC, interesant prin exemplificările cu texte literare din literatura studiată în școală în anii copilăriei mele.

    Mi s-a întâmplat de multe ori, în timp ce introduceam definiții din acest dicționar, să redau în scris astfel de texte literare, ajungând la capătul lor fără să mai urmăresc originalul din care le extrăgeam. Acestea îmi veneau în minte automat, fără nici un fel de efort și fără să le fi repetat de-a lungul anilor (NB  nu mă refer, bine-nțeles la exemplele de texte din publicațiile politice ale vremii; altfel, pe atunci, nu era posibil). Dar Eminescu, Creangă, Vlahuță, Ispirescu, Hasdeu și... și... și... rămăseseră în mintea mea, și asta m-a bucurat mult.

    Admir în continuare munca celor ce au inițiat și condus acest proiect,  muncă ce merită să se bucure de mult, de foarte mult respect.