Automatic document indexing using terms extracted from highlights
DOI:
https://doi.org/10.28998/cirev.2024v11e16800Keywords:
indexing, automation, text highlightsAbstract
The process of indexing and retrieving information plays a crucial role in the efficient organization of documents and quick access to relevant content. The research addresses automation in the document indexing process, also discussing aspects related to extracting terms from highlights. The working methodology takes a qualitative approach, fitting into the category of literature review characterized as narrative, as it was conducted inductively through a bibliographic search for terms related to the themes of the work in indexing databases. The results emphasize the importance of continuous research and the development of effective algorithms for the automatic indexing of documents based on terms extracted from highlights. This approach has the potential to enhance the efficiency of information organization and make document access more accurate and agile in various fields, including Library Science, Information Science, and document management systems.
Downloads
References
AGUIAR, F.; KOBASHI, N. Organização e representação do conhecimento: perspectivas de interlocução interdisciplinar entre Ciência da Informação e Arquivologia. In ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 16.,2013, Florianópolis. Anais [...] Florianópolis: PPGCI, 2013
BERNARDO, J. C. O.; KARWOSKI, A. M. A leitura em dispositivos digitais móveis. ETD - Educação Temática Digital, [S. l.], v. 19, n. 4, p. 795–807, 2017. Disponível em: https://periodicos.sbu.unicamp.br/ojs/index.php/etd/article/view/8646355.
BRASCHER, Marisa; CAFÉ, Ligia. Organização da informação ou organização do conhecimento? In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 9., 2008, São Paulo. Anais [...] São Paulo: PPGCI, 2008. p. 1-14
BRÄSCHER, M.; MONTEIRO, F. S. Organização da informação em repositórios digitais. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, v. 15, n. 29, 2010.
BRAVO, B. R. El documento: entre la tradición y la renovación. Ediciones Trea, 2002
BRITO SILVA, S.R. Sistemas de indexação automática por atribuição: uma análise comparativa. Dissertação (Mestrado em Ciência da Informação – Departamento de Ciência da Informação, Universidade Federal de Pernambuco. Recife. 2020.
BUCKLAND, M. K. What is a document? Journal of the American Society for Information Science, Washington, v.48, n.9, p. 804-809, Sept., 1997.
CAFÉ, Lígia; SALES, R. Organização da informação: conceitos básicos e breve fundamentação teórica. In: Jaime Robredo; Marisa Bräscher (Orgs.). Passeios no Bosque da Informação: Estudos sobre Representação e Organização da Informação e do Conhecimento. Brasília DF: IBICT, 2010. 335 p. ISBN: 978-85-7013-072-3. Capítulo 6, p. 115-129. Edição eletrônica.
COOK, L.K.; MAYER, R.E. Reading Strategies Training for Meaningful Learning from Prose. In: PRESSLEY, M.; LEVIN, J. R. (Ed.) Cognitive Strategy Research. New York? Springer, 1983. p. 87-131. http://dx.doi.org/10.1007/978-1-4612-5519-2_4
DANTAS, T., MANGAS-VEGA, A., GOMÉZ-DÍAZ, R., CORDÓN-GARCÍA, J. A. Pesquisa em leitura e pesquisa em leitura digital: panorama do atual cenário científico. Informação & Sociedade: estudos., João Pessoa, v.27, n.2, p. 117-131, maio/ago. 2017.
DI VESTA, F. J.; GRAY, G. S. Listening and note taking. Journal of Educational Psychology, v. 63, n. 1, p. 8–14, 1972.
FAVERIO, M.; PERRIN, A. Three-in-ten Americans now read e-books. Pew Research Center, 6 jan. 2022. Disponível em: https://www.pewresearch.org/fact-tank/2022/01/06/three-in-ten-americans-now-read-e-bo oks/. Acesso em: 25 fev. 2024.
FIDEL, R. User-oriented indexing. Journal of the American Society for Information Science, v. 45, p. 572-576. 1994.
GIL-LEIVA, I. Manual de indización: teoría y práctica. Gijón: Trea, 2009.
GLUSHKO, Robert J. The Discipline of Organizing: Professional Edition. 4. ed. O'Reilly Media, 2016.
PASCUAL, C. H. El contenido de los documentos textuales: su análisis y representación mediante el lenguaje natural. In: MOREIRO GONZÁLEZ, José Antonio. Anales de Documentación. 2005. p. 285-98. Disponível em: https://revistas.um.es/analesdoc/article/view/3501. Acesso em: 25 fev. 2024.
GOUVEIA, L. M. B; GAIO, S. Sociedade da informação: balanço e oportunidades. Rio de Janeiro: Universidade Fernando Pessoa, 2004.
GUINCHAT, C.; MENOU, M. Introdução geral às ciências e técnicas da informação e documentação. 2.ed. rev. aum. Brasília: Ibict; CNPq, 1994. 540 p.
KELLY, Kevin. O que os Livros se tornarão. In: SILVEIRA, Julio (Org.). Livrolivre, Novas Possibilidades do Digital para a Escrita, a Leitura e a Publicação. Rio de Janeiro: Imã Editorial, 2011. p.17-37.
LANCASTER, F.W. Indexação e Resumos: teoria e prática. 2. ed. Brasília, DF: Briquet de Lemos, 2004
LAPA, R. C.; CORRÊA, R. F. Indexação automática no âmbito da Ciência da Informação no Brasil. Informação & Tecnologia, v. 1, n. 2, p. 59-76, 2014. Disponível em: http://hdl.handle.net/20.500.11959/brapci/41624. Acesso em: 25 fev. 2024.
LE COADIC, Y.F. A Ciência da Informação. 2. ed. Brasília, DF: Briquet de Lemos, 2004
LEUTNER, D.; LEOPOLD, C.; DEN ELZEN-RUMP, V. Self-regulated learning with a text-highlighting strategy: A training experiment. Zeitschrift für Psychologie/Journal of Psychology, v. 215, n. 3, p. 174–182, 2007.
LÓPEZ YEPES, J. Hombre y documento: del homo sapiens al homo documentador. Scire, Zaragoza, v.4, n.2., jul-dec., 1998.
MICHEL, J. L’Information et documentation un domaine d’activité professionnelle en mutation: LCN Les Métiers du Numérique. Hermès, v. 1, n.3, p. 47-64, 2000.
NARUKAWA, C. M.; GIL LEIVA, I.; FUJITA, M. S. L. Indexação Automatizada de Artigos de Periódicos Científicos: análise da aplicação do software SISA com uso da terminologia DeCS na área de Odontologia. Informação & Sociedade: estudos, João Pessoa, v. 19, n.2, p. 99-118, 2009.
OTLET, P. Traité de documentation: le livre sur le livre: théorie et pratique. Bruxelles: Mundaneum, 1934.
PINTO, V. B. Indexação documentária: uma forma de representação do conhecimento registrado. Perspectivas em Ciência da Informação, Belo Horizonte, v.6, n.2, p.223-234, jul./dez., 2001.
ROBREDO, J. Documentação de hoje e de amanhã. 4. ed. rev. ampl. Brasília, DF: Ed. Do Autor, 2005.
SAMPIERI, R. H.; COLLADO, C. F..; LUCIO, M. P. B. Metodologia de pesquisa. 5. ed. Porto Alegre: Penso, 2013.
SANTOS, H. M. D.; FLORES, D. O documento digital no contexto das funções arquivísticas. Páginas A&B, Arquivos e Bibliotecas (Portugal), n. 5, p. 165-177, 2016. Disponível em: http://hdl.handle.net/20.500.11959/brapci/65458.
SHERA, J. H.; EGAN, M. E. Examen del estado actual de la biblioteconomía y de la documentación. Santa Fe, Argentina: Centro de Documentación e Información de Asuntos Municipales Doctor Alcides Greca, 1953.
SILVA, I. C. O.; GOUVEIA, F. C. A busca e o acesso às informações sobre saúde no contexto tecnológico. Revista Conhecimento em Ação, Rio de Janeiro, v. 4, n. 2, p. 23-45, 2019. Disponível em: http://hdl.handle.net/20.500.11959/brapci/127448. Acesso em: 25 fev. 2024.
SILVA, M. Sala de aula interativa. 4. ed. Rio de Janeiro: Quartet, 2006
SIQUEIRA, J. C. A noção de documento digital: uma abordagem terminológica. Em Questão, Porto Alegre, v. 18, n. 1, p. 125–140, 2012. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/24172. Acesso em: 25 fev. 2024.
WEINSTEIN, C; MAYER, R. The Teaching of Learning Strategies. In: WITTROCK, M. (Ed.) Handbook of Research on Teaching, Macmillan, New York. p. 315-327, 1986.
ZAYAS, E. L. et al. O paradigma da educação continuada. Porto Alegre: Penso, 2012.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2024 Os autores são detentores dos direitos autorais e concedem à Ciência da Informação em Revista o direito de publicação simultaneamente disponibilizada de acordo com uma Licença Creative Commons 4.0 Internacional.

This work is licensed under a Creative Commons Attribution 4.0 International License.
A Ciência da Informação em Revista se reserva o direito de realizar, nos originais, verificação da (in)existência de plágio, utilizando, para tanto, o auxílio de software ou outro meio de detecção de plágio em suas diferentes manifestações.
O periodido reserva ainda o direito de realizar, nos originais, alterações de caráter normativo e gramatical, visando à manutenção de padrão, respectivamente, na estrutura e na norma culta da língua adotada.
As provas finais, em nenhum momento, serão enviadas aos autores, sendo diretamente publicadas.
Os originais, em nenhuma circunstância, serão devolvidos aos autores.
A opinião emitida pelos autores é de sua inteira e exclusiva responsabilidade.
Os autores que tiverem seus trabalhos submetidos e publicados concordam que mantêm os respectivos direitos autorais e concedem à Ciência da Informação em Revista o direito de publicação simultaneamente disponibilizada de acordo com uma Licença Creative Commons - Atribuição 4.0 Internacional.