Datblygiad Y Gymraeg Ar Twitter

Datblygiad Y Gymraeg Ar Twitter – Data Techiaith

Wrth bori drwy twitter ychydig yn ôl, ddes i ar draws y neges yma gan @techiaith

Techiaith yw Uned Technolegau Iaith Canolfan Bedwyr ym Mangor sydd yn gweithio i ddatblygu adnoddau Cymraeg (e.e. Cysgair a Cysill). Un o’r adnoddau fwyaf newydd yw’r corpws data twitter– sef swmp anferth o dwîts Cymraeg wedi eu casglu ers 2007. (Linc – http://techiaith.org/corpora/twitter/)

Penderfynais weld pa fath o ddadansoddiadau oedd posib eu creu gyda’r data yma.

Y cam cyntaf oedd lawrlwytho’r ffeiliau, 50 zip file i gyd! Yn ôl y telerau, dim ond un ffeil y diwrnod gaiff un defnyddiwr ei lawrlwytho – felly i gyflymu’r broses, mi wnes i berswadio fy ffrindiau i lawrlwytho un ffeil y dydd hefyd (twyllo braidd – dwi’n cyfaddef!)

Ar ôl casglu’r ffeiliau i gyd – es ati i gychwyn dadansoddi.

Gair o Rybydd

Cyn trafod y canlyniadau, rhaid i mi bwysleisio mai dim ond dadansoddiad bras yw hwn – a dwi wedi cymryd y data yn ei gyfanrwydd fel y mae – “as is”.

Dwi ddim wedi mynd drwyddynt yn chwilio am ddata Saesneg, na thrio eu hidlo, cywiro na’i sortio. Yn ôl y ddogfennaeth ar wefan Techiaith, os oes llai na 30 cymeriad yn y twît, mae’n anoddach i’r meddalwedd adnabod iaith dehongli’r data. Maent yn argymell anwybyddu’r data yma, ond gan mai dim dehongliad academaidd yw hwn – mi wnes i eu gadael i mewn. Mi ges i hefyd ‘chydig o drafferth gyda ambell linell ble roedd y data yn y colofnau anghywir. Mi wnes i anwybyddu’r cofnodion yma.

Cofiwch felly efallai nad yw’r canlyniadau yn adlewyrchiad 100% cywir o’r sefyllfa, ond gobeithiaf fydd yn rhoi rhyw syniad i ni o sut mae’r defnydd o’r iaith wedi newid.

Nifer Twîts Cymraeg ar Twitter

Mae’r data dwi wedi dehongli yn rhedeg o Orffennaf 2007 i Ragfyr 2013, ac yn cwmpasu 2,546,744 twît unigol.

Mae’r graff cyntaf yma yn dangos yn syml y nifer twîts Cymraeg ymhob mis, dros y cyfnod (mae pob cofnod yn y data yn cynnwys yr amser a’r dyddiad cafodd y twît ei greu).

 

Mae’n dangos cynnydd eithaf araf hyd at ddiwedd 2010, ble cynyddu’n sylweddol wedyn. Rhywbeth arall trawiadol yw bod y ffigyrau yn disgyn yn ddramatig ar ôl Awst 2014. Mae’n anodd gen i gredu bod y nifer twîts wedi disgyn i lawr mor gyflym – felly mae’n debyg bod y data am y misoedd mwyaf diweddar ddim mor gyflawn?

Ar gyfartaledd, dros y cyfnod  (gan anwybyddu’r data ar ôl Awst 2014) – mae’r ffigyrau yn dangos cynnydd o ryw 1,200 twît Cymraeg ychwanegol pob mis!

 

Nifer Defnyddwyr Unigryw yn Defnyddio’r Gymraeg

Gan fod pob cyfnod hefyd yn cynnwys rhif unigryw pob defnyddiwr, roedd modd canfod y nifer defnyddwyr unigryw oedd yn defnyddio twitter drwy’r Gymraeg pob mis. Mae’r canlyniadau yn y graff isod

 

Mae’r patrwm tyfiant yn debyg iawn i’r siart cynt, gyda mwy o Gymraeg tua chychwyn 2011. Y tro yma, mae’r tuedd ar gyfartaledd dros y cyfnod yn dangos rhyw 70 defnyddiwr newydd yn trydar yng Nghymraeg pob mis. Wrth gwrs, gall hynna gynnwys defnyddwyr sydd ond unwaith wedi trydar yn Gymraeg!

 

Hashnod Cymraeg Fwyaf Poblogaidd

Yn olaf, ac efallai yn fwy diddorol, mi wnes i edrych ar ba hashnod (hastag neu #) oedd y fwyaf poblogaidd dros y cyfnod. Ar gyfer y rhestr derfynol mi wnes i chwynnu rhai o’r hashnodau Saesneg i ffwrdd, gan gynnwys y rhai generig fel #fail #lol #omg ayyb. Dyma’r 25 uchaf:

 

Yr enillydd clir yw #YAGYM – sef hashnod Yr Awr Gymraeg (linc – https://twitter.com/yrawrgymraeg). Fel un sy’n dilyn y cyfrif ar twitter, dwi’n gwybod pa mor weithgar ac effeithiol yw’r hashnod, gan fydd fy ffrwd yn byrlymu ar nosweithiau Mercher gyda negeseuon yn cynnwys yr hashnod, sydd yn cael ei ail-drydar gan y prif gyfrif.

Mae’r ffaith hefyd na rhywbeth achlysurol yw’r hashnod (dim ond rhwng 20:00 a 21:00 ar nos Fercher mae’r “awr Gymraeg” swyddogol) yn gwneud y ffigyrau yn hyd yn oed mwy trawiadol!

Mae’r YAGYM yn amlwg felly yn enghraifft wych o sut i ddefnyddio twitter fel platfform ymgyrchu neu hyrwyddo.

I gael gweld gweddill y rhestr, dwi wedi cynnwys y 150 uchaf yng ngwaelod y blog yma (clic)

Gwaith Pellach?

Fel nes i grybwyll yn y cychwyn, dim ond trosolwg bras o’r data yw hyn, ac mae modd ei ddadansoddi yn llawer manylach. Mi fysa’n ddiddorol gweld os oes rhyw amser neu ddydd pendant pan mae’r Cymry yn trydar. Diddorol hefyd fysa gweld pa hasnod oedd yn tueddu ymhob mis – gan ffurfio rhyw fath galendr o uchafbwyntiau’r flwyddyn yn ôl twitter. Gan mai mapiau yw fy nghefndir, mi fyswn yn hoffi cael gwybdaeth daearyddol am ble mae’r defnyddwyr Cymraeg o fewn (a thu allan) i’r wlad.

Gyda’r gwaith ardderchog mae Techiaith wedi ei wneud i baratoi a rhyddhau’r data yma, gobeithiaf weld mwy o ddefnydd a dadansoddiadau yn y dyfodol.

Hwyl am y tro

Dafydd

Cydnabyddiaeth

Jones, D. B., Robertson, P., Taborda, A. (2015) Corpws Trydariadau Cymraeg [http://techiaith.org/corpora/twitter]

 

Rhestr Hashnodau Poblogaidd 2007 – 2014

1. #YAGYM – 17591
2. #NEWYDDION – 7196
3. #CYMRAEG – 6810
4. #CYMRU – 6602
5. #S4C – 5520
6. #STEDDFOD2014 – 4387
7. #PLAIDCYMRU – 4086
8. #URDD2014 – 3915
9. #SWYDD – 3807
10. #JOIO – 3672
11. #CAERDYDD – 3319
12. #GWYNEDD – 3140
13. #TARORPOST – 2897
14. #HACIAITH – 2769
15. #EISTEDDFOD – 2615
16. #GWYNEDDJOBS – 2353
17. #POSTCYNTAF – 2311
18. #ABERYSTWYTH – 2277
19. #URDD2013 – 2276
20. #YGWYLL – 2251
21. #DYSGUCYMRAEG – 2016
22. #URDD – 2010
23. #PETHAUBYCHAIN – 1919
24. #STEDDFOD2013 – 1915
25. #YMLAEN – 1903
26. #GWAITHCARTREF – 1851
27. #SWYDDI – 1710
28. #POBOLYCWM – 1706
29. #DIOLCH – 1663
30. #STEDDFOD2012 – 1596
31. #YLLE – 1529
32. #6GWLAD – 1498
33. #CYMRUAMBYTH – 1452
34. #LLANELLI – 1424
35. #RYGBI – 1412
36. #CIG2014 – 1388
37. #PAWBAIFARN – 1372
38. #ABERTAWE – 1299
39. #BUSNES – 1290
40. #RHAGLENDYLAN – 1278
41. #35DIWRNOD – 1227
42. #WALES – 1209
43. #CIG2013 – 1208
44. #6PHETH – 1200
45. #INDYREF – 1195
46. #CYMRUFYW – 1185
47. #REFFALBAN – 1181
48. #STEDDFOD – 1110
49. #SENEDD – 1088
50. #DYDDGWYLDEWI – 1070
51. #TEULU – 1035
52. #YBONT – 1031
53. #NADOLIGLLAWEN – 1024
54. #NADOLIG – 1010
55. #DIMBYD – 993
56. #CAERDYDD – 993
57. #DEWISDOETH – 983
58. #ADOLYGIAD – 974
59. #ARYMARC – 953
60. #POWIPL – 940
61. #CEREDIGION – 895
62. #GWYCH – 895
63. #HER100CERDD – 889
64. #GETHAGER – 884
65. #POSTPRYNHAWN – 880
66. #ARDYFEIC – 878
67. #GOLWG – 871
68. #CYNGHANEDD – 862
69. #HELP – 845
70. #CYSGUNBRYSUR – 844
71. #CIG2012 – 832
72. #TAFWYL – 831
73. #CORCYMRU – 824
74. #DYLANTHOMAS2014 – 820
75. #POBLWC – 815
76. #IEDROSGYMRU – 814
77. #ANWELEDIG – 789
78. #CMONCYMRU – 777
79. #EISTEDDFOD2014 – 776
80. #SHWMAE – 774
81. #GWOBRAURSELAR – 767
82. #WELSH – 735
83. #MAESB – 732
84. #SIANEL62 – 716
85. #CAERFYRDDIN – 714
86. #GIG50 – 709
87. #CAERNARFON – 703
88. #CWPANYBYD – 701
89. #WRECSAM – 700
90. #6NATIONS – 699
91. #DADIDUW – 697
92. #CYFRIFIAD2011 – 686
93. #DGD2 – 685
94. #GWYN – 682
95. #GWENWCHMAENDDYDDGWENER – 678
96. #CYFFROUS – 672
97. #A55 – 669
98. #TENDRO – 663
99. #CYMRU1AF – 661
100. #YNEGESYDD – 659
101. #FIDEO – 651
102. #HAPUS – 649
103. #YNYSMON – 644
104. #IAITH – 636
105. #HAUL – 631
106. #GWERS – 622
107. #CY – 620
108. #IAITHFYW – 617
109. #GERALLT – 609
110. #YNCHWARAE – 606
111. #ADDCYM – 602
112. #CARDIFF – 597
113. #RADIOCYMRU – 597
114. #SANTESDWYNWEN – 595
115. #TOMMO – 588
116. #CBSCSWYDDI – 585
117. #HANNERCANT – 576
118. #WPS – 572
119. #YNYSMÔN – 568
120. #DYSGU – 567
121. #ADDYSG – 566
122. #BLODEUWEDD – 565
123. #ROWNDAROWND – 565
124. #HENO – 564
125. #HWBDYSGU – 561
126. #SESH – 555
127. #LLANRWST – 551
128. #DYDDGWEN – 549
129. #AWRAMAETH – 548
130. #EIRA – 544
131. #AGORDRYSAU – 540
132. #CYMRUFM – 535
133. #FFERMIO – 527
134. #FFITRWYDDACTIF – 520
135. #YRYSGWRN – 516
136. #PRIDD – 515
137. #SGYMRAEG – 510
138. #EOS – 507
139. #LLYF14 – 507
140. #JYSTYPETH – 506
141. #DATHLUDARLLEN – 505
142. #CERDDORIAETH – 502
143. #CIWT – 502
144. #CYNHADLEDDCCC – 501
145. #PRENTISIAETH – 497
146. #ACHUBPANTY – 496
147. #OCHR1 – 495
148. #GWYLNYTH – 495
149. #JOIOBYW – 478
150. #KERNEWEK – 477

5 Comments

  1. Eirwen · Chwefror 25, 2015

    Da iawn Dafydd! Hoffwn wybod sut i drydar yn Gymraeg yn fwy rheolaidd heb elyniaethu dilynwyr di Gymraeg. Mae’r mwyafrif o fy nilynwyr i ddim yn medru’r iaith.

    • Dafydd Elfryn · Chwefror 25, 2015

      Helo Eirwen, diolch am dy neges.
      Efallai nad ydwi yn y person gorau i holi, gan fod y rhan fwyaf o’n ffrindiu twitter yn Gymraeg – ond dal ati fyswn i! Dwi’n siwr fysa dy ddilynwyr ddim yn meindio ambell dwît Cymraeg, a efallai y bysa’n codi diddordeb mewn rhai yn yr iaith. Pob lwc 🙂

  2. Carl Morris · Mawrth 6, 2015

    Difyr iawn, diolch yn fawr am rannu.

    Dw i’n chwarae gyda nhw heno.

  3. Yr Hashnodau Twitter Cymraeg Mwyaf PoblogaiddDyma dwi'n feddwl am hyn… · Mawrth 13, 2015

    […] y blogiad olaf (linc), mi wnes i ddefnyddio data o gorpws twitter techiaiath (linc) i ddadansoddi datblygiad y Gymraeg […]