Pages

Apr 20, 2015

Máquinas virtuais para traduzir e ditar no Apple OS/X para Totós (ou como os Macs são os melhores amigos dos tradutores Portugueses)


RESUMO

O OS/X, o sistema operativo da Apple, inclui nas suas últimas versões a aplicação “Ditado”, que permite ditar para o computador numa panóplia de diferentes idiomas, com a dita máquina a transcrever o texto ditado para o ecrã.

Neste momento, poderão eventualmente pensar “Ah, pois, e tal, isso é o que o Dragon NaturallySpeaking faz!”. Pois é. Mas a versão actual do DNS já não suporta Português, e a aplicação do OS/X, com base no software da mesma Nuance que produz o DNS, suporta Português (deste e do outro lado do Atlântico), Alemão (Suíço e o da Alemanha ), Checo, Chinês (três variantes), Coreano (da Coreia do Sul - assumo que quem estava a desenvolver a versão do Norte foi raptado pelo regime local), Dinamarquês, Eslovaco, Espanhol (três variantes), Finlandês, Francês (três variantes), Grego, Holandês, Húngaro, Indonésio, Inglês (quatro variantes), Italiano (duas variantes), Japonês, Malaio, Norueguês, Polaco, Romeno, Russo, Sueco, Tailandês, Turco, Ucraniano e Vietnamita.

O sistema operativo faz isto descarregando dicionários acústicos com informação acerca do sotaque e idioma esperado, que são processados localmente com base nessa informação. A melhor parte é esta: podem instalar os que quiserem.

Trabalhando eu essencialmente com Português e Inglês, e sendo detentor de uma licença do Dragon Naturally Speaking, pude comparar a funcionalidade de um e outro. No entanto, a maioria das ferramentas CAT não funciona em ambiente OS/X, pelo que se torna necessário recorrer a máquinas virtuais a correrem o Windows para beneficiar simultaneamente das potencialidades acrescidas oferecidas pela Apple e da base comum oferecida pela plataforma da Microsoft.

Assim, estabeleceu-se Inicialmente, uma base comum para avaliar o software de visualização que permita beneficiar do ditar juntamente com aplicações CAT.  Foram avaliados dois pacotes de software de virtualização com exactamente a mesma máquina virtual, e testado o desempenho e funcionalidade em ambos.

INTRODUÇÃO, OU COMO RAIO ACABEI A FORMATAR O MEU PORTÁTIL E A FAZER EXPERIÊNCIAS COM ELE EM NOME DA CIÊNCIA

Há alguns meses atrás, o Kevin Lossner falou-me de um desenvolvimento levado a cabo por William Hardisty e Joana Bernardo, uma aluna sua, que estavam a utilizar a transcrição automática de texto ditado  incluída no OS/X como uma ferramenta de acessibilidade e aumento da produtividade num contexto de tradução. Aliás, esta mesma abordagem foi descrita e discutida num evento na Faculdade de Letras da Universidade de Lisboa, o SDL Day, em 22 de Janeiro de 2015.

A utilização deste recurso não é nada de novo -  a Nuance construiu a reputação da sua empresa com base na família de produtos “Dragon”. Infelizmente, na última versão (que utilizo num PC para a escrita de documentos originais em Inglês, relacionados com os meus objectivos académicos), pude constatar que o Português tinha sido abandonado.

Felizmente, a Apple assegurou que o seu sistema operativo tinha esta funcionalidade. Agora a questão era como implementar essa funcionalidade com as ferramentas disponíveis, a maioria em ambiente Windows.

David Hardisty e Joana Bernardo relataram a sua utilização recorrendo ao Parallels Desktop, uma ferramenta de virtualização para o OS/X, que permitia utilizar este recurso num ambiente instalado na máquina virtual - que pode correr o Windows, entre outros sistemas operativos.

Este artigo debruça-se assim sobre a instalação dos dois  pacotes de software - VMWare Fusion e Parallels Desktop - o seu desempenho e outras observações relevantes.

1 - QUAL O SOFTWARE DE VIRTUALIZAÇÃO A UTILIZAR?


Como referido anteriormente, este artigo debruça-se essencialmente sobre o VMWare Fusion 7 e Parallels Desktop 10, as versões actuais à data da escrita destas palavras. Existem diversas outras aplicações de virtualização, tendo eu utilizado o VirtualBox da Oracle desde o momento em que adquiri a máquina utilizada neste teste comparativo.

Infelizmente, esta última aplicação não permitia a utilização destas funcionalidades pelo que foi imediatamente excluída. É uma pena, porque ao contrário dos outros, é gratuito. Para além disso, serviu-me fielmente até ao momento em que limpei o portátil.

Quer o software da VMWare quer o da Parallels são produtos comerciais, e ambos mencionam a integração da funcionalidade de ditado com o seu sistema de virtualização como argumentos para a sua utilização.

Portanto a questão que se coloca é: funcionam realmente, e qual dos dois é o melhor para este trabalho?


2 - INSTALAÇÃO


Não vos vou maçar com pormenores aborrecidos - digamos que aproveitei a oportunidade para limpar o portátil, tendo-o formatado e feito uma instalação do OS/X Yosemite. A máquina em que foi testado foi o meu fiel Macbook Air de 2013, com 8GB RAM, i5 1.3 GHz e um SSD de 120 GB.

A instalação de ambas as aplicações é bastante simples, e o diálogo para a criação da máquina virtual é praticamente idêntico. Ambos pedem para registarem/comprarem a aplicação, e ambos permitem testá-la - por 14 dias no caso do Parallels Desktop, por 30 no caso do VMware Fusion.


 Como estava a criar uma máquina nova, foi esta a opção que escolhi com o Parallels
 Apontei para um ficheiro ISO (os Macbook Air não têm leitor de CD...)...
 ... e escolhi a opção "Produtividade" para predefinir a configuração da máquina virtual.
Nota importante: Se quiserem configurar a instalação do Windows, desmarquem "Instalação expressa". 
Dei comigo a instalar o Windows em Alemão antes de cancelar a coisa. Eu fiz a activação do Windows no interior da máquina virtual.  
 
Eh... é o Windows 7, pá!
 
E cá está ele a instalar...
... e com o Windows a funcionar, a ditar para o Bloco de Notas!
A instalação do VMWare Fusion é muito semelhante. Eu clonei a máquina Virtual do Parallels para garantir uma igualdade entre ambos. Em todo o caso não registem a aplicação! Eu esperei uns dias e comecei a ver publicidade a oferecer descontos no Parallels, na loja online da empresa :)

3 - CONFIGURAÇÃO DA MÁQUINA VIRTUAL

Ambos os sistemas utilizaram exactamente a mesma configuração: 30 GB de disco, 4 GB RAM, Windows 7 Ultimate, Office 2010 (é a versão que tenho licenciada para PC), Mozilla Firefox e memoQ 2014R2. Foi ainda instalada a aplicação Novabench para medir o desempenho de ambas as máquinas virtuais, a correrem sob definições de desempenho máximo, com o portátil ligado à corrente.

4 - DESEMPENHO E RESULTADOS

Logo após a instalação de qualquer uma das máquinas, o ditado fica imediatamente disponível. Basta utilizar a combinação de teclas predefinida (ou outra) e este começa imediatamente a funcionar, com pouco mais atraso que quando utilizado nativamente no OS/X. Todos os comandos estão disponíveis, e pode-se mudar de idioma através do menu flutuante que acompanha o cursor da escrita. Uma vez que o reconhecimento e voz é nativo do OS/X e transposto para a máquina virtual, não há diferenças imediatamente evidentes entre ambas, embora as medições de desempenho contem outra história.

A avaliação de desempenho do Windows 7 dá uma pontuação mais alta ao Parallels Desktop, em virtude essencialmente do desempenho gráfico.

Parallels Desktop...
...e o VMWare.
Já o Novabench dá o resultado exactamente oposto, com o VMware Fusion a ter um desempenho gráfico marcadamente melhor, embora pior em tudo o resto, especialmente no desempenho do processador.

Parallels Desktop... 
...e VMWare Fusion.

Na prática, durante o período em que o testei, não notei diferenças - admito no entanto que isso possa ser diferente à medida que se utilizam mais e mais recursos do sistema através da máquina virtual.

Quanto ao desempenho da aplicação “Ditado” - é boa. Muito boa, na verdade. Consigo velocidades superiores às do DNS em Inglês, embora tenha de editar mais frequentemente o texto. O “Ditado” requer uma dicção calma, monocórdica e pausada. No seu melhor, resulta em frases de 40, 50 palavras com pouquíssimos erros (um ou outro do dicionário, e costuma ter problemas com artigos que soem ao fim ou início das palavras antecedentes ou seguintes. Também é aborrecido colocar a primeira letra sempre em maiúsculas.

Em termos de velocidade pura, para quem está habituado a utilizar o Dragon juntamente com o teclado e rato (a que o Kevin chama “mixed mode”) a diferença em velocidade e ergonomia é gritante. Este passou a ser o meu equipamento de eleição para tradução.

Descobri que numa casa em que duas crianças pequenas, dois cães e uma gata correm, em números constantemente variáveis entre si, atrás uns dos outros, o velho auricular do meu iPhone 4 me permitia uma melhor qualidade de som ao colocar o microfone mais perto da minha boca e mais longe da algazarra doméstica.

Descobri ainda que existe uma variedade interessante de comandos, não na aplicação “Ditado”, mas na opção Acessibilidade das Preferências do Sistema, sob a opção “Ditado”. Podem activar a opção de Comandos Avançados (que é pelo menos tão detalhada quanto a do DNS), ou criar os vossos próprios comandos.

Localização das opções para a ferramenta Ditado e configuração de comandos da mesma.
Localização da opção "Ditado" no menu de Acessibilidade... 
 ... e a lista de comandos disponíveis (são muitos, mesmo muitos). Ao clicarem no "+" podem criar os vossos próprios comandos!

CONCLUSÃO

Bem, tem que ter um fim, não? Pessoalmente, não notei diferenças entre o VMWare e o Parallels quanto ao ditar o texto e em velocidade, apesar dos resultados dos testes de desempenho.
No entanto, o Paralells oferece algumas coisas interessantes, tais como integração directa com o ambiente do Yosemite (podem copiar ficheiros de e para a Máquina Virtual de dentro dela ou fora).
Isto é-me particularmente útil porque assim só preciso de ter uma cópia do conteúdo local da minha Google Drive, ao invés de uma em cada máquina, virtual ou verdadeira.

Gostei ainda da possibilidade de lançar directamente as aplicações da máquina virtual a partir do Launchpad.


Dito isto, e considerando o desconto, decidi-me pelo Parallels Desktop. Considerando a minha utilização da Google Drive para questões administrativas, dá-me um jeitaço ter apenas de sincronizar uma cópia da mesma no OS/X, a qual é acedida pela máquina virtual.

Contudo, o VMWare é uma boa opção, e a diferença de desempenho não me foi notória, pelo que suponho seja uma questão de escolherem conforme a vossa preferência. O VMware é mais barato (o preço fica parecido com os códigos de desconto), mas permite a instalação em três máquinas, para além de outras diferenças. O Parallels apenas permite instalar numa.

Divirtam-se, e bom trabalho!

(Este bocado de prosa foi escrito no mais absoluto desrespeito pelo Acordo Ortográfico. Assim se escreve em bom Português.)


******

This guest post was submitted by Tiago Neto, a German/English to European Portuguese translator and veterinarian, who has written what I believe to be the first article comparing the efficiency of different virtual machines for Windows-based translation environments running on Apple Macintosh hardware. Thank you, Tiago!


Apr 3, 2015

Free, good quality speech recognition for Portuguese, Arabic and more in your pocket!


This blog post was produced by voice dictation on my iPhone 4S in a crowded restaurant with a lot of background noise. This evening I came to my favorite hangout to work, to get away from home for a while after a very long and stressful day.

I forgot my glasses when I left home, so I cannot see the screen of my computer well enough to type accurately. Essentially, I am working as if I were blind. I thought of driving home to fetch my glasses and then returning here to work, but I did not want to take the time. So, I thought that this would be the ideal opportunity to test the dictation workflow which I have been showing to so many people in quite a few languages in the last few weeks. Of course I am doing this in my native language (English), but this would work just as well if I were a native speaker of Arabic or Romanian or Portuguese, for example. What I am experiencing so far in this test is that after speaking for a certain amount of time, during which a text chunk of a certain size has been generated, the application stops and communicates with the transcription server from Nuance online, producing the transcribed text in the language which I am speaking. However, that does not pose a great difficulty; I can simply restart the recording and the text continues. If I want to, I can make corrections with an on-screen keyboard on my mobile phone, but I prefer to email the text after I am finished and make any changes or corrections on my computer. The last few weeks have been very interesting. At the JABA Partner Summit in Porto, Portugal, and later at the GALA conference in Seville, Spain, I tested this workflow together with native speakers of many languages not supported by Dragon NaturallySpeaking from Nuance. In every case the results seemed to be excellent, but the texts generated during the tests were usually rather short, no more than one or two paragraphs.

This is the longest text that I have created by this process so far. I find that the "chunking" behavior of the application is actually helpful. It allows me to look at groups of text that are not too large (about enough to fill the screen of the iPhone) and make important corrections manually before I continue. On the whole, this is in fact a rather comfortable process. With it, I can hang out in the barn with my goats and chickens and a printout and translate comfortably with a beer in one hand. Not bad. The ergonomic aspects are excellent. I am dictating this text in English with a great deal of noise coming from the nearby kitchen and the television which is less than 3 m from me, blaring loudly in Portuguese.

I am very satisfied with the results of tonight's test. And I hope that others will explore this workflow further, creating new possibilities for better, more profitable work in many languages using this new speech recognition capability. I think this is a game-changer.

This works on any Apple mobile device, such as the iPhone, iPad or iPod. The app to download from the App Store is called "Dragon Dictation". It is free. I discovered this particular possibility after reading time and again the quality of speech recognition on mobile devices is actually superior to what is available on desktop computers, because that is where all of the research time and money is currently being invested. It took me a while to realize the implications of this, but now I see that many can benefit a great deal from the possibilities that this makes available. I look forward to reports of work in other languages. (The only language that I have discovered to have significant restrictions so far is Japanese, where apparently the Kanji recognition is not very good and Hiragana characters are used too often, making a text difficult to read for a native speaker. Steve Vitek tells me that the problem is that there are too many homophones in Japanese, but that this should work well in another language such as Mandarin Chinese. The initial tests with Mandarin Chinese in Seville, Spain actually looked rather good.)

After dictation and transcription are complete, a few button presses can send the text to an e-mail server for manual or automated processing.



Sent from my iPhone



Recorded at Cantinho Da Ti Bilete in Évora, Portugal. Photos by César Almeida.


Mar 31, 2015

Sinking in the bulk market bog of #xl8

Facebook is a veritable cesspit of bulk market stupidity in translation... name changed to protect the... innocent(?)
If anyone questions why I need massive infusions of Egyptian doum palm tea and karkadé to survive the tribulations of translation, they need look no further than social media, particularly Facebook. Some years ago many people assumed that the unprofessional character and abuses one finds on bulk market reverse auction portals like ProZ.com (aka PrAdZ, ProtZ and many other variants) were due to repressive site policies, or some particular, special evil found only in repurposed chambers in a country once known for dropping political opponents of the junta from helicopters into the sea, but in the meantime some have figured out that this is the Human Condition or at least that of translators and their keepers who choose to dwell in common in the bulk market bog of failure and mediocracy. Of course one can find excellence, even beauty and dream-inspiring experiences of the most creative kind there or in many other unexpected places; I once found the most magnificent opium poppy growing in my dung heap on the farm I had in Oregon years ago. So really, it's not the medium... it's the messengers, who shall always be among us. Hooray for the wisdom of hermits!

Siberian shamans have some cool recipes for this beautiful, deadly mushroom so common in dem Vaterland
I have been subject to social media assault for translation rather often (#yessometranslators), which is the nicer term I can think of for being granted involuntary membership in some of the FB groups which sprout like toadstools. Not all groups which are created in that medium of fertilizer are toxic; some in fact could be characterized as rather tasty shitakes or Portabello mushrooms. But almost everywhere in these media, once can see and hear the incessant, self-harming whine about "outrageous rates" and the perpetual lament that "there will always be someone to accept such starvation remuneration" as if this implied that we must all bow to the "inevitable" and sell our bodies in the bulk word brothels of Moreslavia et alia.

This problem is hardly confined to translator circles; since I began a career involved with commercial translation, I have continued to act, as I have for 30 years now, as a consultant and trainer for relevant technologies and strategies of work and business. I have supported translation agencies and direct buyers of translation services of every size to assert themselves effectively and ethically in a market which often presents very difficult and complex challenges. And from this year forward, with a growing team of educational psychology specialists, university instructors, technical specialists, interns and others, I will do so to an even greater extent.

I have observed for some seven years now, with great sadness, how many translation companies who really earned the label Language Service Providers (LSPs) instead of Linguistic Sausage Producers (LSPs) have circled the drain and gone down because they believed the lies of the buyer-driven bulk market of which Smartling's Jack Welde speaks with such rapture. Quite a number of these principals of failed companies were and are friends of mine. But somewhere along the line, they lost sight of some fundamentals and thought that the competitive market is all about price, or even when they knew it was not, they sometimes lacked the insight or resources to resist the race to the bottom of the drain into the cesspit.

Thus it was my pleasure at the recent GALA conference in Seville to share some ideas with many key business people from diverse backgrounds with many languages, so that they might have more options to follow their hearts and heads and enjoy a more sustainable and satisfying business model with which we all win. There were a few toads in the crowd there, but why waste a lot of time on them, The Toxic Ten Percent, when the venue was full of the 90% whose philosophies and business goals are very much in accord with the interests of individual service providers such as freelance translators and editors? When I shared some workflows which might offer effective means of applying speech recognition in languages previously thought not to be supported, a number of translation company owners and operations managers spontaneously declared their happiness that the freelancers they depend on could now earn a better livinng despite low piece rates in their languages. Such "dirty capitalists" are our natural allies and ought to be considered friends in the trenches of the war with those who fail to understand that disruptive innovation is a bottom-up, evolutionary movement of change which can, with the understanding of ordinary human decency and ethics, be a positive thing and fertile ground for a sustainable, professional crop. It is not the destruction rained down on villages like Guernica by the Great Powers of Lionbridge and their like. 

So what to do about the bogsters, the Linguistic Sausage Purveyors (LSPs) who dare to promote more slavery to us slavelancers and digital sharecroppers in a post-apocalyptic translationscape? Nothing. Ignore them. Or invite them to a hot date in the sand with a goat. But please, people, leave off the incessant public whine about rates, forget about piece rate nonsense and focus on value, effective earnings for the time invested and sustainable business practices. You can tear down any house faster than you can build one, but ya gotta live somewhere.

And, just for fun, you can share some interesting tidbits with colleagues and buyers about how, when one approaches the price break limits of a silly bulkster discount scale such as that in the screenshot above, you can add some unneeded words to the job and get the whole lot of words for less: