S78
mos pelos usuários (Nova Spivack, 2013). Nos
últimos anos, os avanços tecnológicos e o desen-
volvimento da internet têm conduzido à criação
de diversos aplicativos utilizados principalmente
para facilitar a interação entre as pessoas. Com
isso, a sociedade moderna pôde ser apresentada
aos computadores pessoais, aos
e-mails
, à
web
, ao
comércio eletrónico, aos sistemas de busca, às
tecnologias de rede sem fios, às músicas
on-line
,
aos vídeos
on-line
, aos
smartphones
e às diversas
redes sociais. Hoje a
internet
é uma rede de pes-
soas e comunidades, deixando de ser apenas uma
rede de computadores.
No contexto da evolução da
web
, tem-se a glo-
balização, que já não é um exclusivo das maiores
empresas multinacionais do mundo. Hoje a digi-
talização eliminou muitas das barreiras que im-
pediam que pequenas e médias empresas (PME),
empresários e cidadãos comuns fizessem as suas
conexões com clientes e fornecedores em todo
o mundo. A globalização digital, por exemplo,
tem implicações significativas, principalmente no
que tange às empresas e economias dos países em
desenvolvimento. Nessas nações, as empresas e indiví-
duos podem usar plataformas digitais como uma forma
de superar as restrições nos seus mercados locais. Desta
forma é possível identificar oportunidades, informações
e ideias em qualquer lugar do mundo.
Considerando os aspetos da globalização digital, a lite-
ratura académica destaca-se sobremaneira, com acesso
praticamente instantâneo graças à mídia social e outras
plataformas da
internet
, pois os indivíduos estão-se co-
nectando. Estima-se que quase um bilhão de pessoas
ao redor do mundo são participantes diretos de algu-
ma forma de globalização. Análises do
Facebook, Twitter,
e
, mostram que 914 milhões de pessoas
têm pelo menos uma conexão internacional em uma
plataforma de mídia social.
Pode-se considerar que o desenvolvimento de uma in-
vestigação não é mais linear. A velocidade dessa evolu-
ção tem um ritmo acelerado. O ritmo de mudança de
paradigma, de novas ideias tem sido muito acelerado no
mundo da era do conhecimento. Destaca-se que as pri-
meiras mudanças, embora aparentemente rápidas, leva-
ram anos para se desenvolverem. Exemplifica-se pelo
sequenciamento do HIV que levou 15 anos e o sequen-
ciamento do SARS, que levou somente 21 dias.
Dado o avanço tecnológico em todas as áreas da ciência,
aliado à evolução tecnológica, é mister o tratamento do
grande volume de dados, ainda mais dos dados da área
da saúde, responsável por 47% de toda a informação.
O volume exaustivo de dados, requer que o mesmo
seja organizado e estruturado para o possível subsídio
ao tomador de decisão. Nesse sentido, a utilização de
ferramentas de engenharia de busca e posterior trata-
mento desse volume, como, por exemplo, uma platafor-
ma livre
Carrot Search Lingo4G
®, auxilia sobremaneira o
tratamento dos dados disponíveis (J. Magalhães, Bastos,
& Barroso, 2016). Somente como exemplo, de modo a
estimar-se a quantidade de informação disponível refe-
rente a “
big data
” e “saúde” (
health
em inglês), realizou-
-se inicialmente busca no
Carrot Search Lingo3G
® com o
termo “
big data
”. Foram extraídos 349.000.000 resulta-
dos. Destes, após a mineração, obteve-se os termos mais
“evidentes” no objeto pesquisado (que mais se repetem)
e indexados somente na base
PubMed
e, posteriormente,
segregando os que possuíam o termo “health” no pri-
meiro resultado com o termo “
big data
”, foram obtidos
100
clusters
que possuíam o total de 5.564 documentos
essenciais, classificados de acordo com as principais in-
cidências, como se nota na Figura 1.
Em razão da quantidade crescente de informação adi-
cionada diariamente aos bancos de dados, analisar o es-
tado da arte científica e tecnológica e extrair a infor-
mação essencial para tomada de decisão, torna-se tarefa
quase impossível empregando-se os meios tradicionais.
Nesse âmbito, a tecnologia da informação tem contri-
buído com ferramentas que auxiliam este processo em
qualquer área da ciência. Não obstante, além dos
sof-
twares
pagos (
textmining, datamining
etc.), as ferramen-
tas de acesso livre da
Web
2.0 proporcionam uma opção
para tratar volume de dados para as organizações que
não possuem uma robusta facilidade de aquisição e ma-
nutenção de
softwares
e mecanismos de busca privados
(licenças de uso). Desta forma, ao utilizar mecanismos
de acesso livre, há razoabilidade em obter a informação
Figura 1.
Análise do termo
Big Data
e “Saúde”
Fonte: extraído pelos autores em CarrotLingo4g.
Big Data
e ciência aberta