...that is the question.

jueves, 4 de junio de 2015

ANÀLISI LEXICOMÈTRICA V

CONCLUSIÓ


    Arribats ja al final del projecte de recerca de l'assignatura Escriptures Hipertextuals, només queda una última entrada en forma de conclusió. En primer lloc, voldria destacar la utilitat del programa AntConc pel que fa a l'estudi lexicomètric. Dóna moltes possibilitats per tal d'analitzar textos i ofereix un gran ventall d'eines diferents. Encara que m'hagi costat una mica al principi, és un programa molt fàcil de dominar i realment serveix per treure el suc dels arxius seleccionats.

    Per accedir al conjunt dels posts que formen el projecte de recerca en forma digital, cliqueu aquí o aquí.

    Quant a l'assignatura en general, m'ha sorprès agradablement perquè no sabia ben bé que m'esperava. Ha estat una assignatura que em demanava dedicar-hi força temps amb les diverses i de vegades denses lectures, però eren necessàries per tenir una visió global de l'impacte dels textos hipertextuals en la societat moderna. Ja que ens efecte profundament, hem vist diversos punts de vista relacionats amb l'hipertextualitat, des de la informàtica i la literatura fins la psicologia i la sociologia, tot passant per la lingüística i la ciència cognitives.

    En definitiva, puc afirmar que sóc hipertextual, o més ben dit, som hipertextuals. Som hipertextual perquè les nostres estructures mentals funcionen d’acord amb les lleis de la hipertextualitat. No solament aprenem i pensem en xarxa, mitjançant infinits enllaços, sinó també escrivim i actuem seguint les regles relatius del llenguatge, fortament influïdes pels sistemes hipertextuals. Som el resultat d’una construcció social i digital, i ens adaptem a les noves realitats de manera automàtica i dinàmica. Els hipertextuals, sens dubte, som nosaltres mateixos.



miércoles, 3 de junio de 2015

ANÀLISI LEXICOMÈTRICA IV

    Finalment, en aquest últim post sobre l'estudi lexicomètric dels blogs de Jordi Navarro de la CUP Girona i la Concepció Veray del PPC Girona, analitzarem amb més detall l'ús d'unes paraules concretes amb l'eina Concordance KWIC (key word in context). Aquest eina troba una paraula o expressió i la col·loca dins el seu context, com veurem en els gràfics següents.

1.- tot*
   Ja que el mot Tot ha sortit en la quarta posició dels més utilitzats de l'arxiu de textos de Navarro, amb un 0,25%, i la paraula Tots apareix en el vuitè lloc de la llista de Veray, amb un 0,36%, m'ha semblat interessant aprofundir encara més en aquesta direcció. He generat concordances no només amb aquestes paraules, sinó amb totes les que tinguin el començament de tot. És a dir, afegint l'asterisc (tot*) perquè quedin triades també els mots totatotes i tothom. Aquí veiem els resultats:

Jordi Navarro

Concepció Veray
    El que mostren els gràfics és que el total nombre de paraules que comencen amb tot en els texts de Navarro és de 33. Dels 16 tot hi podem afegir 17 paraules més, entre les quals hi consten totstotes i tothom, amb 9, 2 i 4 entrades respectivamentDels 18 tots originals de Veray, podem afegir 11 paraules més que formen els 29 mots que comencen amb tot. En el cas de Veray 8 d'aquestes 11 paraules és tot. Només apareix dues vegades el mot tota, un cop el mot totes, i en cap cas el mot tothom.

2.- nos*
    Ara passem a la segona anàlisi KWIC, aquesta vegada prenent atenció especial al mot nos. He triat aquesta paraula perquè ha sortit com una de la més utilitzades en el primer exercici (wordlist). Tanmateix, l'he eliminat de la selecció per ser un pronom. Estava interessat en veure quantes vegades els autors l'havien fet servir i de quines maneres. Per això, he generat la cerca de les concordances del mot nos*, especificant-la a les paraules nos, nosaltres, nostre, nostra i nostresAquí veiem els resultats:

Jordi Navarro

Concepció Veray
    Els resultats mostren que Navarro ha utilitzat nos 37 vegades, mentre Veray l'ha fet servir 25 vegades. Això resulta en una freqüència del 0,57% dels textos de Navarro, una mica més que la paraula utilitzada amb més freqüència (Catalunya). Pel que fa als textos de Veray, els 25 nos són un 0,50% del total de les paraules utilitzades, el qual faria que pugés a la posició sisena de la seva llista de paraules freqüents.

martes, 2 de junio de 2015

ANÀLISI LEXICOMÈTRICA III

    L'objectiu d'aquest post és doble. D'una banda, es tracta de comparar algunes de les paraules més freqüents de cada blog amb la quantitat de vegades que surten a l'altre. D'aquesta manera, podem establir relacions entre els dos blogs i, sobretot, mostrar les diferències pel que fa a la tria del llenguatge. De nou, s'ha fet servir l'eina Word List per obtenir aquestes dades. D'altra banda, farem servir l'eina Concordance Plot per tal de mostrar les concordances d'una manera gràfica. Cada arxiu està representat com un codi de barres, el qual indica en què posició apareix el terme cercat.

    Tot seguit, mostrem les dades sobre algunes paraules destacades dels dos blogs. En primer lloc, tenim un gràfic amb cinc mots molt utilitzats per en Jordi Navarro de la CUP. En segon lloc, el gràfic mostra algunes paraules significatives de la Concepció Veray. En tots dos casos comparem els mots amb l'ús que els ha donat l'altre autor.

Paraula
Freqüència (%) Navarro
Freqüència (%) Veray
Catalunya
33 (0,51%)
4 (0,08%)
Social
15 (0,23%)
1 (0,02%)
Crisi
11 (0,17%)
3 (0,06%)
Gent
11 (0,17%)
2 (0,04%)
Pobresa
11 (0,17%)
0 (0,00%)

Paraula
Freqüència (%) Veray
Freqüència (%) Navarro
Girona
65 (1,34%)
11 (0,16%)
Ciutat
42 (0,84%)
9 (0,14%)
Candidatura
16 (0,32%)
1 (0,02%)
Ajuntament
15 (0,30%)
7 (0,11%)
Econòmica
15 (0,30%)
10 (0,15%)

    Veiem en el primer cas que algunes de les paraules més utilitzades per Navarro són a penes utilitzades per Veray. Catalunya, que és el mot més utilitzat per Navarro, només apareix quatre vegades en l'arxiu de Veray amb un percentatge petitíssim. A més, les paraules relacionades amb la ideologia de l'esquerra, com ara Social o Crisi, surten encara menys. Cal remarcar que el mot Pobresa, en la vuitena posició de Navarro, ni tan sols apareix en cap de les entrades de Veray. Concloem que Navarro fa servir un llenguatge específic amb unes paraules que Veray no utilitza gaire sovint.

    Per la seva banda, les paraules que apareixen amb molta freqüència en el blog de Veray no són tan escasses en el blog de Navarro. Només el mot Candidatura té un percentatge molt baix amb solament una entrada. Les paraules Girona, Ciutat i Econòmica o bé estan en la llista de les quinze paraules més utilitzades (vegeu: http://touocornottouoc.blogspot.com.es/2015/06/analisi-lexicometric-ii.html) o bé apareixen entre les primeres vint-i-cinc. Tanmateix, la diferència entre els percentatges dels mots que fa servir Veray i els de Navarro són remarcables. Concloem que Veray fa servir unes paraules amb molta més freqüència, encara que algunes d'aquestes també són utilitzades per Navarro.

    Ara passem a la segona part d'aquest post, els gràfic de concordances. Per tal de mostrar el seu ús en els dos blogs s'ha triat quatre mots (o començaments del mot): cat* (Catalunya, català, catalana...), pp* (PP, PPC), Girona i pais (país, països). El primers gràfics mostren els resultats del text de Navarro, mentre els segons mostren les concordances amb l'arxiu de Veray.

    Els resultats són molt clars i mostren com un autor pot utilitzar una paraula o expressió de manera continuada, i de vegades repetitiva, mentre l'altre a penes la fa servir. Pel que fa als mots que comencen amb cat* i pais*, Navarro els empra força sovint i amb molta més freqüència que Veray. Veiem que Navarro utilitza cat* moltes vegades per uns escrits i gairebé mai per uns altres. El seu ús de pais*, en canvi, és distribuït més igualment. D'altra banda, quant als mots pp* i girona, Veray els dóna un ús força més elevat que Navarro. Pp* apareix contínuament en les seves entrades, mentre ha emprat el mot girona moltes vegades durant els primers posts, però molt poc en els últims.

lunes, 1 de junio de 2015

ANÀLISI LEXICOMÈTRICA II

    Per tal d'analitzar els continguts dels blogs de manera eficient, he creat un sol document (en forma .txt) que reuneix el conjunt de tot els textos de cada blog. D'aquesta manera, disposo d'un bloc d'informació de cada autor, el qual resulta molt manejable i més coherent que no pas un document de cada post.

    La primera anàlisi que s'ha fet és la de destacar les paraules que s'han utilitzat amb més freqüència, l'anomenat wordlist. Els següents gràfics no només mostren l'ordre de les paraules més utilitzades, sinó també la quantitat de vegades que surten i el percentatge que representen sobre el total de paraules escrites. Cal dir que he eliminat de la tria els mots que podien distorsionar el resultat, com ara preposicions i adverbis, formes verbals (és, nos, han, han, estat, etc.) i conjuncions.

Jordi Navarro:
Ordre
Paraula
Freqüència
Percentatge
1
Catalunya
33
0,51%
2
Ple
20
0,31%
3
País
19
0,30%
4
CIU
16
0,25%

Tot
16
0,25%
5
Estat
15
0,23%

Ser
15
0,23%

Social
15
0,23%
6
Discurs
13
0,20%

ERC
13
0,20%
7
Realitat
12
0,19%
8
Crisi
11
0,17%

Gent
11
0,17%

Girona
11
0,17%

Pobresa
11
0,17%

    Veiem que la paraula feta servir amb més freqüència per en Jordi Navarro és Catalunya, seguit per Ple i, en tercer lloc, País. Tanmateix, el percentatge és força baix, fet que mostra l'ús d'una àmplia varietat de mots diferents en el conjunt. Sens dubte, aquesta anàlisi de les paraules més utilitzades ens dóna alguna pista sobre la ideologia d'en Jordi Navarro. Destaquen diversos mots que representen la seva lluita des de l'esquerra, com ara Social, Discurs, Realitat, Crisi i Pobresa. Curiosament, la quarta paraula més utilitzada és CIU, mentre ERC està en la sisena posició. La sigla CUP, en canvi, no apareix fins al 'ranking' 189 amb només quatre entrades.


Concepció Veray:
Ordre
Paraula
Freqüència
Percentatge
1
Veray
67
1,34%
2
Girona
65
1,3%
3
Ciutat
42
0,84%
4
PPC
28
0,56%
5
Popular
27
0,54%
6
Govern
24
0,48%
7
Explicat
21
0,42%
8
Fer
18
0,36%

Tots
18
0,36%
9
Concepció
17
0,34%

Sentit
17
0,34%
10
Candidatura
16
0,32%

Portaveu
16
0,32%
11
Ajuntament
15
0,30%

Econòmica
15
0,30%

    La paraula feta servir amb més freqüència per la Concepció Veray és el seu propi cognom, Veray, amb 67 entrades i un 1,34% del total de totes les paraules. El mot Concepció té la novena posició. També destaquen les paraules que fan referència al seu partit. La quarta més utilitzada és PPC i la cinquena és PopularAltres paraules més generals formen part de les més utilitzades, amb Girona i Ciutat en les posicions segona i tercera, respectivament. Tampoc no sorprenen els mots propis d'una campanya electoral com ara Govern, Candidatura i Ajuntament.

    Quan comparem els resultats podem trobar similituds i diferències. Pel que fa als similituds, duna banda, els mots Girona i Tot/s apareixen en les dues anàlisi. Veray fa servir Girona 65 vegades, un 1,3% del total del text, mentre les 11 entrades de Navarro només representen un 0,17% del conjunt dels seus textos. Tot (en el cas de Navarro) o Tots (en el cas de Veray) és l'única altra coincidència entre les dues llistes. D'altra banda, veiem que és remarcable l'ús d'alguns verbs. Ser apareix en la setena posició dels mots més utilitzats de Navarro, però Veray fa servir d'altres com ara Explicar, Fer i Sentir.

    Quants a les diferències, voldria destacar l'aparent egoisme dels textos de la candidata del Partit Popular. No solament és el nom de l'autora la paraula més freqüent, sinó que també són molt utilitzades els signes del seu partit, PPC, com el mot Popular. De fet, el percentatge de la freqüència en què apareix aquestes paraules, en la quarta i cinquena posicions, és més alt que el de la primera paraula del blog de Navarro. Això mostra que el blog de Veray utilitza les mateixes paraules amb més freqüència, mentre el blog de Navarro, com hem dit, no reforça tant la seva ideologia mitjançant la repetició.