Loading

Non podemos máis que saudar e aplaudir a publicación por parte do IGE deste vocabulario estatístico, que se vén a sumar ao elaborado e publicado no seu día pola Universidade da Coruña. É unha noticia magnífica que por fin poidamos falar con rigor e naturalidade de desvío padrón no canto de desviación típica ou estándar, de mostraxe como o proceso de realización dunha mostra e de asignación ou repartición e non de afixación á tarefa de deseñala teoricamente, ou de arredondar un número e non de redondealo.

Na escola quen subscrebe tomaba os apuntamentos das aulas en galego sen importar se o mestre falaba en galego ou en castelán. Hoxe é evidente para min que a capacidade de escribir e falar en galego con corrección é froito dese esforzo infinitesimal reiterado hora tras hora e día tras día durante anos.

Logo, no instituto, sentinme atraído pola estatística e durante a carreira axiña vin confirmada esa querenza natural polos números: estatistica, econometría, métodos cuantitativos… Pero os manuais das autoridades académicas españolas (mestres de mestres) que entón se manexaban nos cursos introdutorios parecíanme densos, pesados, lentos, embarullados e pouco didácticos. Así que, dunha forma natural, rebuscando un pouco na biblioteca da facultade, dei cos dous volumes do libro Probabilidades e Estatística de Bento José Murteira Ferreira, profesor catedrático da Universidade Nova de Lisboa, a que non coñezo de nada pero a quen imaxinei sempre como un vello portugués tan entrañábel como o José Saramago ou o Manoel de Oliveira.

Neses libros fundamentei os meus principais estudos na materia e neles aprendín de forma natural a linguaxe técnica estatística do meu idioma. Sempre tiven o convencemento, tanto na Estatística canto noutras disciplinas, que a transposición automática da terminoloxía científica castelán ao galego faille un fraco favor á nosa lingua. Anos máis tarde tiven un déjà vú desta sensación ao se publicaren os primeiros vocabularios de informática en lingua galega.

Non é que non valore os enormes esforzos desinteresados feitos por moita e moi boa xente, á hora de elaborar vocabularios específicos desta ou daqueloutra materia. Cómpre recoñecer neste campo o traballo pioneiro das Universidades, dos Servizos de Normalización e dos propios estudantes e profesionais saídos delas, pero sempre botei en falla un maior nivel de profundamento, de participación e de debate colectivo sobre as razóns que levaban a escoller tal ou cal termo. Quizá os tempos das wikis chegaron demasiado tarde ao proceso normalizador da lingua galega. Máis de 25 anos para termos un vocabulario de Estatística!

A seguir paso a comentar algúns dos termos que incorpora este novo vocabulario, así como a criticar algunha das escollas realizadas.

En Estatística un acontecemento nunca foi un caso ou un suceso (éxito en portugués, e tamén en galego nunha das súas acepcións), e moito menos unha ocorrencia, por iso me disgusta a escolla feita polo IGE e me agrada a feita pola UDC.

En lingua galega, salvo excepcións, o adxectivo sempre segue ao nome e non o antecede, e o método o que fai é minimizar sumas cadradas, facelas mínimas. Daí que debamos falar de cadrados mínimos e non de mínimos cadrados como propoñen ambos vocabularios.

Por moito que a miña desactualización me leve a consideralas formas chocantes, concordo no uso de acuracia (IGE) en vez de acuracidade (UDC) para referírmonos á dobre propiedade dun estimador ser preciso e sen nesgo (inglés accurate), e que podemos resumir etimoloxicamente como posesión da cualidade de agudo, do mesmo xeito que se falaramos dunha persoa sagaz ou perspicaz ou dun instrumento fino e afiado. Con todo boto de menos o emprego do termo fiel, tan empregado noutras disciplinas.

Acho controvertido o uso de nesgo (IGE) no canto de sesgo (UDC), xa que é esta última a forma coincidente no castelán (nome) e no portugués (adxectivo). Ambas formas e os súas derivadas están ausentes no dicionario da Real Academia, e a dicir verdade eu sempre ouvín desde pequeno á miña nai costureira falar do viés , nome tamén existente no portugués (do inglés bias e/ou o francés biais), opción pola que me inclino e que me permite falar sen custo ningún de estimadores non enviesados (unbiased estimator) .

Discrepo da fixación da forma ponderación (IGE) como única forma en vez de admitir de forma ambivalente a de peso (UDC) para weight, aínda que por razóns de rigor e economía preferiría a fixación de peso como forma única, que ademais é transposición directa do significado orixinal en inglés.

Atinadas, pola súa proximidade ao idioma hexemónico no estado da arte, son as solucións completeza (completeness) para nos referir á cualidade de completo e intersecto para intercept, o punto de corte dunha recta de regresión co eixo de ordenadas.

Cando menos controvertida é a proposta de palabras patrimoniais, que son propias e únicas do galego, en varios lugares do vocabulario do IGE:

Esta é a filosofía escollida polos autores do vocabulario para o termo chouto (en portugués ten o sentido do castelán trote) en vez da máis común salto para jump, estrema en substitución de límite ou raia para boundary, ou quiñón no canto de cota ou parte para share. E aínda que o vocabulario nos leve a aprender palabras fermosas como doela para nos referir aos segmentos definidos por unha función polinómica de interpolación (spline) quizá sexa máis práctico para a difusión e comunicación dos produtos científicos galegos procurar formas comúns co tronco lingüístico do galego-portugués.

Xa no seu día discutín con José Ramon Pichel a utilización de grade (cf. gradiente) para referirse á inclinación (slope) dunha recta de regresión co gallo da tradución ao galego das funcións ou fórmulas do aplicativo Excel da Microsoft. O IGE aposta para o mesmo termo pola forma declive, escolla que tampouco me convence xa que na fala coloquial transmite a idea de sentido descendente, e na etimolóxica a de desnivel, interrupción ou separación. A UDC mantén a forma máis estendida pendente (castelán pendiente), malia a que entimoloxicamente refira algo que pende ou colga. Eu aposto decididamente por inclinación.

Son todas estas palabras patrimoniais propostas sen dúbida merecentes de ser conservadas, mais quizá a súa escolla peca senón de hiperenxebrismo si dun excesivo espírito diferenciador a respecto das linguas viciñas, e poden afastar máis que atraer (?) a aquelas persoas que teñan pensado dar o chouto ao galego desde outro idioma.

Creo humildemente que é un castelanismo usar fogar no canto de simplemente casa (coas equivalencias antigas lar -tamén recollida de forma secundaria polo vocabulario- e lume, que corresponderían historicamente á definición actual de vivenda principal ocupada), ou para nos referir á familia ou unidade de convivencia (se nos referimos aos seus habitantes). Por esa razón eu reservaría a tamén palabra patrimonial galega cela (castelán celda, inglés cell) en vez de casa (usada no portugués, castelán casilla) para cada espazo para riscar ou escribir un díxito ou letra que hai nun cuestionario.

Noutro plano, non me acaban de convencer as escollas da forma aberrante para outlier, e considero mellor a opción literal saliente ou a máis estendida raro.

Tampouco acho totalmente satisfactorio a escolla da solución pauta para pattern no canto de padrón, outra palabra galega patrimonial, esquecida dos dicionarios malia a dar nome a unha vila do noso país, e que partillaría étimo co termo inglés, aínda que podo dala como válida para diferenciar esta idea da empregada no termo desvío padrón.

Unha lea monumental é a que hai formada tanto no inglés, canto no castelán e no galego coas denominacións e definicións das diferentes clases de indicadores, que tamén bailan dependendo da disciplina científica que os emprega. Sei que é van o meu intento por pór orde mais vouno intentar: proportion debería ser traducíbel non como fracción (IGE) senón transparentemente como proporción (UDC), e desde logo rate debería ser en rigor razón (UDC), ración, ou se preferimos termos matemáticos, radio (latín ratio, portugués rácio), aínda que en moitos casos esteamos afeitos a empregar taxa. Como digo, en calquera caso conviría facer un esforzo interdisciplinar e internacional para diferenciar claramente e fixar os conceptos de fracción, proporción, razón e taxa.

Dependendo do contexto tampouco acho axeitado imbricación (IGE) no canto de superposición para overlapping (castelán solapamiento).

Paréceme acertado o emprego da opción clasificación para sorting, con só termos claro que sorte é en galego precisamente clase ou especie,  e que sort é clasificar unha variedade de cousas (cf. galletas surtidas), e non necesariamente implicando unha xerarquía (rank) ou orde (order).

Por último, seremos quen de escribir diagrama de caixa e patillas para falarmos dun box-and-whiskers plot? E premio para o primeiro que atinara a escribir algunha vez correctamente Chebixef. :)

Top