
Se tem estado atento à IA, provavelmente já viu as imagens. Visuais deslumbrantemente belos, estranhos e maravilhosos que parecem ter saído de um filme de ficção científica ou de um romance de fantasia. Há uma boa probabilidade de muitos deles terem sido feitos com o Midjourney, o gerador de imagens de IA que consegue transformar algumas palavras numa obra-prima.
Uma demonstração do bot Midjourney no Discord, que é uma ferramenta poderosa para gerar imagens de IA.
Quando o Midjourney apareceu pela primeira vez, era praticamente o rei da arte de IA. Mas à medida que outras ferramentas como o DALL·E 3 e o Stable Diffusion melhoraram, a conversa começou a mudar. As pessoas estão a deparar-se com alguns obstáculos consideráveis com o Midjourney que o tornam difícil de usar para algo mais do que um projeto paralelo divertido.
Este guia irá guiá-lo por tudo o que precisa de saber sobre o Midjourney. Abordaremos o que é, como se utiliza (o que é uma história por si só), o que torna a sua arte tão especial e as principais limitações que precisa de conhecer, desde a sua interface de utilizador desajeitada até à sua total falta de uma API.
O que é o Midjourney?
O Midjourney é um laboratório de investigação independente e a ferramenta de IA que criou. Em suma, é uma ferramenta de IA privada que cria rapidamente imagens com base em descrições de texto, ou "prompts", como são chamados. Ao contrário de outros modelos de que talvez já tenha ouvido falar (como o Stable Diffusion), o Midjourney é de código fechado. Não se pode espreitar por baixo do capô para ver como funciona.
Durante muito tempo, a única forma de aceder era através de um bot na plataforma de chat Discord, o que moldou toda a sua experiência de utilizador e comunidade desde o primeiro dia.
Na sua essência, o Midjourney consiste em pegar nas suas palavras e transformá-las em algo belo e artístico, muitas vezes com um toque de pintura. Tem um talento especial para coisas como composição e iluminação, o que faz com que as suas imagens pareçam polidas desde o início. Não é apenas uma utilidade para fazer imagens; a empresa vê-se como uma plataforma para "expandir os poderes imaginativos da espécie humana."
Como funciona o Midjourney: A configuração e a experiência do utilizador
Começar a usar o Midjourney sempre foi… um pouco complicado. Embora tenham lançado recentemente uma aplicação web, o seu ADN ainda está profundamente ligado ao Discord, uma plataforma que pode ser uma verdadeira barreira se nunca a utilizou antes.
A abordagem “primeiro o Discord” do Midjourney
Durante muito tempo, usar o Midjourney significava viver no Discord. Eis como isso funciona:
-
Junte-se ao servidor: Primeiro, precisa de uma conta no Discord. Depois, tem de juntar-se ao servidor oficial do Midjourney, que acolhe mais de 20 milhões de pessoas.
-
Use o comando
/imagine
: Encontra um dos canais designados para "novatos", escreve/imagine
e depois escreve o seu prompt de texto. -
Gerar e esperar: O bot põe-se a trabalhar e apresenta quatro opções de imagem nesse canal público. A partir daí, pode escolher uma para "upscale" (tornar maior e mais detalhada) ou criar novas variações.
Uma captura de ecrã que mostra o processo de geração de imagens do Midjourney na interface de utilizador do Discord.
Embora isto crie uma comunidade movimentada e criativa, também é caótico. Os canais públicos são uma cascata incessante da arte de outras pessoas, e é ridiculamente fácil perder o rasto das suas próprias gerações. Além disso, uma interface de linha de comandos não é exatamente intuitiva para a maioria das pessoas. É uma curva de aprendizagem que, francamente, desmotiva muitas pessoas.
A nova interface web do Midjourney
O Midjourney ouviu as queixas e finalmente começou a lançar uma aplicação web. Oferece uma experiência mais convencional, onde escreve o seu prompt numa barra de pesquisa e vê as suas criações numa galeria organizada. Esta é uma grande melhoria, mas a reputação da ferramenta ainda é fortemente influenciada pelas suas origens no Discord.
Toda esta configuração é uma enorme dor de cabeça para qualquer empresa que queira realmente trabalhar. Não pode pedir a toda a sua equipa para aprender a usar o Discord apenas para uma ferramenta. É por isso que plataformas como a eesel AI são construídas para funcionar onde você trabalha, integrando-se diretamente em ferramentas como o Slack em vez de o forçar a usar uma nova.
Principais características e pontos fortes artísticos do Midjourney
Apesar das dores de cabeça de usabilidade, há uma razão para o Midjourney se ter tornado tão popular: a sua produção artística é incrível. Tem uma estética distinta que muitas vezes parece mais polida e com direção de arte do que os seus rivais, logo à partida.
As imagens simplesmente ficam boas. O Midjourney é um mestre na criação de iluminação bonita, composição forte e no aproveitamento de um profundo conhecimento da história e estilos da arte. Os seus prompts produzem frequentemente resultados que parecem arte conceptual profissional ou pinturas digitais.
Também tem o seu próprio "visual" distinto. Ao contrário de algumas ferramentas de IA que lhe dão uma tela em branco, o Midjourney tem uma predisposição incorporada para o que fica bem, o que é uma grande ajuda para iniciantes que ainda não dominaram a escrita de prompts super detalhados. Também é estranhamente bom a entender prompts sobre humores, emoções e movimentos artísticos, tornando-o uma ferramenta divertida para simplesmente explorar ideias. Além disso, a equipa está constantemente a lançar novas versões, cada uma um grande salto em realismo e compreensão.
As limitações e os desafios do Midjourney
Embora seja um sonho para artistas, o Midjourney tem algumas limitações sérias que o tornam uma má escolha para a maioria das pessoas, especialmente num ambiente de negócios.
Sem acesso à API do Midjourney
Este é o grande problema, especialmente se está a pensar usá-lo para trabalho. O Midjourney não tem API. Em termos simples, isso significa que não o pode ligar a outro software, sites ou fluxos de trabalho automatizados. Não pode construir uma aplicação que use a tecnologia do Midjourney ou tê-lo a gerar imagens automaticamente como parte de um processo. É um jardim murado, concebido como uma ferramenta autónoma, não como um bloco de construção para algo maior.
Para as empresas, a integração é tudo. Pense numa ferramenta de suporte de IA como a eesel AI. O seu propósito principal é integrar-se com a sua base de conhecimento, como o Confluence, e o seu help desk, como o Zendesk ou o Intercom, para automatizar respostas. Isso é impossível sem uma API.
Moderação de conteúdo restritiva do Midjourney
O filtro de conteúdo do Midjourney é… agressivo. Para dizer o mínimo. Os utilizadores relatam constantemente que prompts completamente inocentes são bloqueados. Palavras relacionadas com o corpo humano ou até com design de moda podem acionar um aviso ou levar a uma proibição. O objetivo é evitar imagens não seguras para o trabalho (NSFW), mas o filtro é tão zeloso que muitas vezes atrapalha o trabalho criativo legítimo.
Preocupações com a privacidade no Midjourney
Quer trabalhar num projeto sem que o mundo inteiro esteja a ver? Por defeito, não pode. Todas as imagens são geradas publicamente no Discord, a menos que desembolse pelos planos Pro ou Mega, mais caros, que lhe dão acesso ao "Modo Furtivo". Para quem trabalha em projetos sensíveis ou privados, esta falta de privacidade nos planos mais baratos é um grande obstáculo.
Falta de um plano gratuito no Midjourney
E se quiser apenas explorar e ver o que ele pode fazer? Azar. O Midjourney acabou com o seu período de teste gratuito em abril de 2023 porque estava a tornar-se demasiado popular. Agora é um serviço puramente pago, o que impede os utilizadores casuais de o experimentarem e provavelmente ajudou os concorrentes a ganhar terreno.
Preços do Midjourney
Então, quanto custa tudo isto? O Midjourney funciona com um modelo de subscrição com quatro níveis. Todos eles dão acesso à galeria da comunidade e permitem que use as imagens comercialmente, mas a principal diferença é a quantidade de "Tempo Rápido de GPU" que obtém. O modo Rápido gera as suas imagens imediatamente, enquanto o modo Relaxado o coloca numa fila (e não está disponível no plano mais barato).
Eis um resumo rápido dos planos mensais padrão:
Plano | Preço Mensal | Preço Anual (/mês) | Tempo Rápido de GPU | Tempo Relaxado de GPU | Principais Características |
---|---|---|---|---|---|
Plano Básico | $10 | $8 | 3,3 h/mês | Nenhum | Gerações limitadas (~200/mês) |
Plano Padrão | $30 | $24 | 15 h/mês | Ilimitado | Gerações relaxadas ilimitadas |
Plano Pro | $60 | $48 | 30 h/mês | Ilimitado | Modo Furtivo para imagens privadas |
Plano Mega | $120 | $96 | 60 h/mês | Ilimitado | Modo Furtivo, mais horas rápidas |
A principal conclusão aqui é que a verdadeira privacidade começa nos $60 por mês, o que pode ser um preço elevado para freelancers ou pequenas equipas.
Considerações finais sobre o Midjourney
Então, qual é o veredito sobre o Midjourney? É uma ferramenta fantástica para artistas, designers e qualquer pessoa que queira criar imagens deslumbrantes e únicas. Para pura diversão criativa, é difícil de superar.
Mas para negócios? A história é diferente. A interface estranha do Discord, a falta de privacidade nos planos mais baratos e, especialmente, a ausência de uma API tornam-no uma opção inviável para a maioria das empresas. É uma ferramenta fechada, concebida para criar imagens únicas manualmente, não para automação ou integração.
Se procura uma IA que realmente se integre no seu fluxo de trabalho em vez de se isolar, precisa de um tipo diferente de ferramenta. Plataformas como a eesel AI são construídas de raiz para serem self-service, controláveis e ligadas ao software do qual já depende.
Pronto para ver como a IA pode funcionar dentro das suas ferramentas existentes, e não fora delas? Descubra como a eesel AI pode automatizar o suporte e unificar o conhecimento para a sua equipa.
Perguntas frequentes
Começar a usar o Midjourney tradicionalmente envolve entrar no seu servidor do Discord, usar o comando "/imagine" em canais públicos e gerir as criações lá. Embora uma aplicação web esteja agora disponível, as suas origens implicam uma curva de aprendizagem, especialmente se for novo no Discord.
O Midjourney destaca-se na composição, iluminação e no aproveitamento da história da arte, produzindo frequentemente imagens que parecem arte conceptual profissional. Tem uma estética distinta e uma "predisposição incorporada para o que fica bem," tornando-o amigável para iniciantes alcançarem resultados polidos.
Atualmente, o Midjourney não oferece API, o que significa que não se pode integrar com outro software, websites ou fluxos de trabalho automatizados. Esta falta de integração torna-o um obstáculo significativo para as empresas que pretendem automatizar a geração de imagens ou ligá-lo a sistemas existentes.
Sim, a privacidade é uma preocupação nos planos mais baratos do Midjourney, pois todas as imagens são geradas publicamente por defeito no Discord. Para trabalhar em projetos privados, precisa de subscrever os planos Pro ou Mega, mais caros, para aceder ao "Modo Furtivo."
Não, o Midjourney descontinuou o seu período de teste gratuito em abril de 2023 devido à alta procura. Atualmente, é um serviço puramente pago, que requer uma subscrição mesmo para a exploração inicial.
O Midjourney oferece quatro níveis de subscrição (Básico, Padrão, Pro, Mega) que variam de $10 a $120 por mês. Os planos diferem principalmente na quantidade de "Tempo Rápido de GPU" fornecido e no acesso a funcionalidades como o "Modo Furtivo" para a geração de imagens privadas.