Apr 20, 2015

Máquinas virtuais para traduzir e ditar no Apple OS/X para Totós (ou como os Macs são os melhores amigos dos tradutores Portugueses)


RESUMO

O OS/X, o sistema operativo da Apple, inclui nas suas últimas versões a aplicação “Ditado”, que permite ditar para o computador numa panóplia de diferentes idiomas, com a dita máquina a transcrever o texto ditado para o ecrã.

Neste momento, poderão eventualmente pensar “Ah, pois, e tal, isso é o que o Dragon NaturallySpeaking faz!”. Pois é. Mas a versão actual do DNS já não suporta Português, e a aplicação do OS/X, com base no software da mesma Nuance que produz o DNS, suporta Português (deste e do outro lado do Atlântico), Alemão (Suíço e o da Alemanha ), Checo, Chinês (três variantes), Coreano (da Coreia do Sul - assumo que quem estava a desenvolver a versão do Norte foi raptado pelo regime local), Dinamarquês, Eslovaco, Espanhol (três variantes), Finlandês, Francês (três variantes), Grego, Holandês, Húngaro, Indonésio, Inglês (quatro variantes), Italiano (duas variantes), Japonês, Malaio, Norueguês, Polaco, Romeno, Russo, Sueco, Tailandês, Turco, Ucraniano e Vietnamita.

O sistema operativo faz isto descarregando dicionários acústicos com informação acerca do sotaque e idioma esperado, que são processados localmente com base nessa informação. A melhor parte é esta: podem instalar os que quiserem.

Trabalhando eu essencialmente com Português e Inglês, e sendo detentor de uma licença do Dragon Naturally Speaking, pude comparar a funcionalidade de um e outro. No entanto, a maioria das ferramentas CAT não funciona em ambiente OS/X, pelo que se torna necessário recorrer a máquinas virtuais a correrem o Windows para beneficiar simultaneamente das potencialidades acrescidas oferecidas pela Apple e da base comum oferecida pela plataforma da Microsoft.

Assim, estabeleceu-se Inicialmente, uma base comum para avaliar o software de visualização que permita beneficiar do ditar juntamente com aplicações CAT.  Foram avaliados dois pacotes de software de virtualização com exactamente a mesma máquina virtual, e testado o desempenho e funcionalidade em ambos.

INTRODUÇÃO, OU COMO RAIO ACABEI A FORMATAR O MEU PORTÁTIL E A FAZER EXPERIÊNCIAS COM ELE EM NOME DA CIÊNCIA

Há alguns meses atrás, o Kevin Lossner falou-me de um desenvolvimento levado a cabo por William Hardisty e Joana Bernardo, uma aluna sua, que estavam a utilizar a transcrição automática de texto ditado  incluída no OS/X como uma ferramenta de acessibilidade e aumento da produtividade num contexto de tradução. Aliás, esta mesma abordagem foi descrita e discutida num evento na Faculdade de Letras da Universidade de Lisboa, o SDL Day, em 22 de Janeiro de 2015.

A utilização deste recurso não é nada de novo -  a Nuance construiu a reputação da sua empresa com base na família de produtos “Dragon”. Infelizmente, na última versão (que utilizo num PC para a escrita de documentos originais em Inglês, relacionados com os meus objectivos académicos), pude constatar que o Português tinha sido abandonado.

Felizmente, a Apple assegurou que o seu sistema operativo tinha esta funcionalidade. Agora a questão era como implementar essa funcionalidade com as ferramentas disponíveis, a maioria em ambiente Windows.

David Hardisty e Joana Bernardo relataram a sua utilização recorrendo ao Parallels Desktop, uma ferramenta de virtualização para o OS/X, que permitia utilizar este recurso num ambiente instalado na máquina virtual - que pode correr o Windows, entre outros sistemas operativos.

Este artigo debruça-se assim sobre a instalação dos dois  pacotes de software - VMWare Fusion e Parallels Desktop - o seu desempenho e outras observações relevantes.

1 - QUAL O SOFTWARE DE VIRTUALIZAÇÃO A UTILIZAR?


Como referido anteriormente, este artigo debruça-se essencialmente sobre o VMWare Fusion 7 e Parallels Desktop 10, as versões actuais à data da escrita destas palavras. Existem diversas outras aplicações de virtualização, tendo eu utilizado o VirtualBox da Oracle desde o momento em que adquiri a máquina utilizada neste teste comparativo.

Infelizmente, esta última aplicação não permitia a utilização destas funcionalidades pelo que foi imediatamente excluída. É uma pena, porque ao contrário dos outros, é gratuito. Para além disso, serviu-me fielmente até ao momento em que limpei o portátil.

Quer o software da VMWare quer o da Parallels são produtos comerciais, e ambos mencionam a integração da funcionalidade de ditado com o seu sistema de virtualização como argumentos para a sua utilização.

Portanto a questão que se coloca é: funcionam realmente, e qual dos dois é o melhor para este trabalho?


2 - INSTALAÇÃO


Não vos vou maçar com pormenores aborrecidos - digamos que aproveitei a oportunidade para limpar o portátil, tendo-o formatado e feito uma instalação do OS/X Yosemite. A máquina em que foi testado foi o meu fiel Macbook Air de 2013, com 8GB RAM, i5 1.3 GHz e um SSD de 120 GB.

A instalação de ambas as aplicações é bastante simples, e o diálogo para a criação da máquina virtual é praticamente idêntico. Ambos pedem para registarem/comprarem a aplicação, e ambos permitem testá-la - por 14 dias no caso do Parallels Desktop, por 30 no caso do VMware Fusion.


 Como estava a criar uma máquina nova, foi esta a opção que escolhi com o Parallels
 Apontei para um ficheiro ISO (os Macbook Air não têm leitor de CD...)...
 ... e escolhi a opção "Produtividade" para predefinir a configuração da máquina virtual.
Nota importante: Se quiserem configurar a instalação do Windows, desmarquem "Instalação expressa". 
Dei comigo a instalar o Windows em Alemão antes de cancelar a coisa. Eu fiz a activação do Windows no interior da máquina virtual.  
 
Eh... é o Windows 7, pá!
 
E cá está ele a instalar...
... e com o Windows a funcionar, a ditar para o Bloco de Notas!
A instalação do VMWare Fusion é muito semelhante. Eu clonei a máquina Virtual do Parallels para garantir uma igualdade entre ambos. Em todo o caso não registem a aplicação! Eu esperei uns dias e comecei a ver publicidade a oferecer descontos no Parallels, na loja online da empresa :)

3 - CONFIGURAÇÃO DA MÁQUINA VIRTUAL

Ambos os sistemas utilizaram exactamente a mesma configuração: 30 GB de disco, 4 GB RAM, Windows 7 Ultimate, Office 2010 (é a versão que tenho licenciada para PC), Mozilla Firefox e memoQ 2014R2. Foi ainda instalada a aplicação Novabench para medir o desempenho de ambas as máquinas virtuais, a correrem sob definições de desempenho máximo, com o portátil ligado à corrente.

4 - DESEMPENHO E RESULTADOS

Logo após a instalação de qualquer uma das máquinas, o ditado fica imediatamente disponível. Basta utilizar a combinação de teclas predefinida (ou outra) e este começa imediatamente a funcionar, com pouco mais atraso que quando utilizado nativamente no OS/X. Todos os comandos estão disponíveis, e pode-se mudar de idioma através do menu flutuante que acompanha o cursor da escrita. Uma vez que o reconhecimento e voz é nativo do OS/X e transposto para a máquina virtual, não há diferenças imediatamente evidentes entre ambas, embora as medições de desempenho contem outra história.

A avaliação de desempenho do Windows 7 dá uma pontuação mais alta ao Parallels Desktop, em virtude essencialmente do desempenho gráfico.

Parallels Desktop...
...e o VMWare.
Já o Novabench dá o resultado exactamente oposto, com o VMware Fusion a ter um desempenho gráfico marcadamente melhor, embora pior em tudo o resto, especialmente no desempenho do processador.

Parallels Desktop... 
...e VMWare Fusion.

Na prática, durante o período em que o testei, não notei diferenças - admito no entanto que isso possa ser diferente à medida que se utilizam mais e mais recursos do sistema através da máquina virtual.

Quanto ao desempenho da aplicação “Ditado” - é boa. Muito boa, na verdade. Consigo velocidades superiores às do DNS em Inglês, embora tenha de editar mais frequentemente o texto. O “Ditado” requer uma dicção calma, monocórdica e pausada. No seu melhor, resulta em frases de 40, 50 palavras com pouquíssimos erros (um ou outro do dicionário, e costuma ter problemas com artigos que soem ao fim ou início das palavras antecedentes ou seguintes. Também é aborrecido colocar a primeira letra sempre em maiúsculas.

Em termos de velocidade pura, para quem está habituado a utilizar o Dragon juntamente com o teclado e rato (a que o Kevin chama “mixed mode”) a diferença em velocidade e ergonomia é gritante. Este passou a ser o meu equipamento de eleição para tradução.

Descobri que numa casa em que duas crianças pequenas, dois cães e uma gata correm, em números constantemente variáveis entre si, atrás uns dos outros, o velho auricular do meu iPhone 4 me permitia uma melhor qualidade de som ao colocar o microfone mais perto da minha boca e mais longe da algazarra doméstica.

Descobri ainda que existe uma variedade interessante de comandos, não na aplicação “Ditado”, mas na opção Acessibilidade das Preferências do Sistema, sob a opção “Ditado”. Podem activar a opção de Comandos Avançados (que é pelo menos tão detalhada quanto a do DNS), ou criar os vossos próprios comandos.

Localização das opções para a ferramenta Ditado e configuração de comandos da mesma.
Localização da opção "Ditado" no menu de Acessibilidade... 
 ... e a lista de comandos disponíveis (são muitos, mesmo muitos). Ao clicarem no "+" podem criar os vossos próprios comandos!

CONCLUSÃO

Bem, tem que ter um fim, não? Pessoalmente, não notei diferenças entre o VMWare e o Parallels quanto ao ditar o texto e em velocidade, apesar dos resultados dos testes de desempenho.
No entanto, o Paralells oferece algumas coisas interessantes, tais como integração directa com o ambiente do Yosemite (podem copiar ficheiros de e para a Máquina Virtual de dentro dela ou fora).
Isto é-me particularmente útil porque assim só preciso de ter uma cópia do conteúdo local da minha Google Drive, ao invés de uma em cada máquina, virtual ou verdadeira.

Gostei ainda da possibilidade de lançar directamente as aplicações da máquina virtual a partir do Launchpad.


Dito isto, e considerando o desconto, decidi-me pelo Parallels Desktop. Considerando a minha utilização da Google Drive para questões administrativas, dá-me um jeitaço ter apenas de sincronizar uma cópia da mesma no OS/X, a qual é acedida pela máquina virtual.

Contudo, o VMWare é uma boa opção, e a diferença de desempenho não me foi notória, pelo que suponho seja uma questão de escolherem conforme a vossa preferência. O VMware é mais barato (o preço fica parecido com os códigos de desconto), mas permite a instalação em três máquinas, para além de outras diferenças. O Parallels apenas permite instalar numa.

Divirtam-se, e bom trabalho!

(Este bocado de prosa foi escrito no mais absoluto desrespeito pelo Acordo Ortográfico. Assim se escreve em bom Português.)


******

This guest post was submitted by Tiago Neto, a German/English to European Portuguese translator and veterinarian, who has written what I believe to be the first article comparing the efficiency of different virtual machines for Windows-based translation environments running on Apple Macintosh hardware. Thank you, Tiago!

10 comments:

  1. I don't speak Portuguese, so I used machine translation to read this wonderful article (I know, I know, the irony is not lost on me). It is therefore likely that I didn't understand all the information as intended, and especially the subtleties and nuances that often make all the difference, so I apologize in advance if any of my comments are out of context or place.

    1) As far as I know, VMware Fusion allows copying and pasting between the host (OS X) and guest (Windows) systems. Maybe a setting should be invoked?

    2) As a free alternative I suggest having a look at VirtualBox. Its Seamless Mode similar to the way Parallels and VMware Fusion integrates the guest system into OS X - not as elegant and seamless perhaps, but not bad either. The first thing I'd be interested to know, of course, is if the dictation works with VirtualBox.

    3) Because everything works well on MacBook Air there is no real need to venture further, but for educational purposes it would be interested to test how this works in a MacBook Pro/iMac with a quad core processor and at least 16GB of RAM.

    Either way, kudos for Apple for integrating the support for many new languages into the OS. I wonder if Windows 10 with its Cortana component marks the beginning of a change on the Windows side. I'm also curious to know when, if at all, more languages will find their way into the official desktop version of DNS.

    I'm also curious to see how the landscape of the translation environment tools will change over the course of the next five years or so. If .Net will become a reliable cross-platform infrastructure, this could mean an even more tighter integration.

    Thank you Tiago and Kevin for this interesting article.

    ReplyDelete
  2. Thanks for the compliment, Shae.

    All three VM apps - VirtualBox, Parallels and VMWare allow for shared clipboards, the settings for which can be found in the Preferences/Settings panel for each application.
    What Parallels does better than the others is to actually use a sort of "alias" scheme to allow you to access the VM contents from within Yosemite and vice-versa.

    Sadly, VirtualBox (which served me faithfully for nearly two years) seems not to allow the call to the Dictation app. I could never get the keystroke combination to work with it. It's a shame, because VirtualBox is both good and free.

    As for the higher-end Mac, I volunteer to be a recipient of such a machine :)

    ReplyDelete
    Replies
    1. We have some Macbooks in "processing" which will allow for the sort of investigation Shai suggested, and this is part of the current internship plan with my company to look into these things and develop corresponding training materials. Now that the possibilities of speech recognition are available in some form to most translators in a rather large number of dictation languages, it is worth the effort to look into these matters in great, thorough detail. This is a viable and profitable path to pursue *now* and it will only get better. As for the various naysayers who have explained to me why typing is so much better, all I can do is smile and think of that stupid "blacksmith" puff piece that Nataly Kelly put up in HuffPo a while back. It might actually fit that lot, but either way, it's not my concern. I know what I have to do to protect my own health, and I know what I want my friends to have available to them to protect their health and possibly improve their efficiency, earnings, life satisfaction, whatever. The rest does not interest me. At GALA in Seville I had some silly German professor try to complete all my sentences without having the slightest idea what I was talking about, then when he finally knew he decalred that the findings were insignificant, because there were "so many" ways to do what I had shown him. "Really?" I asked. Any of them commercially viable today? This afternoon?" No answer to that. Someone will probably end up on the scrap heap eventually, so if his sort want to volunteer, who am I to stand in their way? The rest of us can just take the pressure off a little. I'm thinking of ways to apply the latest findings to writing in grade schools, as an alternative to all that stupid keyboarding. And other things. Let the nattering nabobs chatter as they like....

      Delete
    2. Thank you Tiago. I suspected that much about VirtualBox. It would perhaps be a good idea to report this issue in their forums.

      I don't use OS X (it never was really an option because historically MacOS didn't play nice with Hebrew, even in the written form, so there was really no point insisting - but I hear changes are supposed to come in this department as well) so except for playing around with it here and there, I lack a more in-depth perceptive. But my impression was always that Parallels is the most balanced and seamless way to go about this type of virtualization in MacOS. I imagine that you can use shared folders in VirtualBox and VMplayer/Fusion to achieve a two-way data sharing, but it is probably not as convenient or trivial to set up compared to Parallels.

      Kevin, your research into dictation and its practical application is, and will be, invaluable. Now that we are one step closer to dictation for (almost) all major languages, and further steps are on the horizon, the discourse will probably become more pragmatic.
      Indeed, some people will not care for dictation, and some probably really do prefer typing. That's fine. Dictation should not become the new MpT with everyone who doesn't see its value or care for it automatically pegged as a Luddite.
      I think that the benefits of dictation speak (pun intended) for themselves, and when more material and real-world examples will be available, people will start realizing how they can fit it into their workflow.

      For the first time in quite a few years I'm excited about some up and coming developments in translation supporting technology

      Delete
    3. For me, dictation is just another tool in my toolbox. It just happens to be the one that works really well with all the others, all for my convenience. To be radically against MpT or speech recognition is just denying oneself the chance of: a) learning for yourself if there are any merits to said tool, and what merits are those; b) to professionally develop oneself, due to this learning experience; c) actually have a better return from the time one spends working.

      Somethings work, somethings don't. Some work rather well, others not at all. For me, this works rather well, along with my little bag of tricks I picked up over the years. I'd encourage people to try it and evaluate it. I didn't warm up to it on my first attempt (I think Kevin has a video of me failing miserably at dictating in Portuguese), but the problem was actually with the way I talked. One thing dictation does do, apart from the ergonomic benefits, is to actually improve the clarity of your speech.

      Delete
  3. This comment has been removed by the author.

    ReplyDelete
  4. Lista de comandos da ferramenta "Ditado" para o Yosemite:
    https://support.apple.com/kb/PH18735?viewlocale=pt_PT&locale=pt_PT


    (Desculpem, tinha posto o link para o Mountain Lion no post acima)

    ReplyDelete
  5. It is just a tool... but it's a tool with which a properly experienced and skilled translator can produce a (closely proofread) 3000 word translation in about 2 hrs.

    Not suitable for all occasions - but a game changer if ever I saw one....

    ReplyDelete
  6. Another update: If you are in any way tied to academia, you can get Parallels for 50% the regular price.

    ReplyDelete
  7. I'm actually convinced that there is no reason to use virtualisation for a freelance translator, there are very good CAT tools for Mac that don't require Parallels or Fusion. You can handle Studio, Transit and memoQ projects on your Mac. You will have to use Java, but this is a small 'price' compared to using Windows, in my opinion.

    ReplyDelete

Notice to spammers: your locations are being traced and fed to the recreational target list for my new line of chemical weapon drones :-)