Search Results - "Dey, Manan"

1

Assessing Viewer's Mental Health by Detecting Depression in YouTube Videos by Sharma, Shanya, Dey, Manan

Published 29-07-2020

“…Depression is one of the most prevalent mental health issues around the world, proving to be one of the leading causes of suicide and placing large economic…”
Get full text

Journal Article

2

How sensitive are translation systems to extra contexts? Mitigating gender bias in Neural Machine Translation models through relevant contexts by Sharma, Shanya, Dey, Manan, Sinha, Koustuv

Published 22-05-2022

“…Neural Machine Translation systems built on top of Transformer-based architectures are routinely improving the state-of-the-art in translation quality…”
Get full text

Journal Article

3

Evaluating Gender Bias in Natural Language Inference by Sharma, Shanya, Dey, Manan, Sinha, Koustuv

Published 12-05-2021

“…Gender-bias stereotypes have recently raised significant ethical concerns in natural language processing. However, progress in detection and evaluation of…”
Get full text

Journal Article

4

Between words and characters: A Brief History of Open-Vocabulary Modeling and Tokenization in NLP by Mielke, Sabrina J, Alyafeai, Zaid, Salesky, Elizabeth, Raffel, Colin, Dey, Manan, Gallé, Matthias, Raja, Arun, Si, Chenglei, Lee, Wilson Y, Sagot, Benoît, Tan, Samson

Published 20-12-2021

“…What are the units of text that we want to model? From bytes to multi-word expressions, text can be analyzed and generated at many granularities. Until…”
Get full text

Journal Article

5

Consent in Crisis: The Rapid Decline of the AI Data Commons by Longpre, Shayne, Mahari, Robert, Lee, Ariel, Lund, Campbell, Oderinwale, Hamidah, Brannon, William, Saxena, Nayan, Obeng-Marnu, Naana, South, Tobin, Hunter, Cole, Klyman, Kevin, Klamm, Christopher, Schoelkopf, Hailey, Singh, Nikhil, Cherep, Manuel, Anis, Ahmad, Dinh, An, Chitongo, Caroline, Yin, Da, Sileo, Damien, Mataciunas, Deividas, Misra, Diganta, Alghamdi, Emad, Shippole, Enrico, Zhang, Jianguo, Materzynska, Joanna, Qian, Kun, Tiwary, Kush, Miranda, Lester, Dey, Manan, Liang, Minnie, Hamdy, Mohammed, Muennighoff, Niklas, Ye, Seonghyeon, Kim, Seungone, Mohanty, Shrestha, Gupta, Vipul, Sharma, Vivek, Chien, Vu Minh, Zhou, Xuhui, Li, Yizhi, Xiong, Caiming, Villa, Luis, Biderman, Stella, Li, Hanlin, Ippolito, Daphne, Hooker, Sara, Kabbara, Jad, Pentland, Sandy

Published 20-07-2024

“…General-purpose artificial intelligence (AI) systems are built on massive swathes of public web data, assembled into corpora such as C4, RefinedWeb, and Dolma…”
Get full text

Journal Article

6

StarCoder 2 and The Stack v2: The Next Generation by Lozhkov, Anton, Li, Raymond, Allal, Loubna Ben, Cassano, Federico, Lamy-Poirier, Joel, Tazi, Nouamane, Tang, Ao, Pykhtar, Dmytro, Liu, Jiawei, Wei, Yuxiang, Liu, Tianyang, Tian, Max, Kocetkov, Denis, Zucker, Arthur, Belkada, Younes, Wang, Zijian, Liu, Qian, Abulkhanov, Dmitry, Paul, Indraneil, Li, Zhuang, Li, Wen-Ding, Risdal, Megan, Li, Jia, Zhu, Jian, Zhuo, Terry Yue, Zheltonozhskii, Evgenii, Dade, Nii Osae Osae, Yu, Wenhao, Krauß, Lucas, Jain, Naman, Su, Yixuan, He, Xuanli, Dey, Manan, Abati, Edoardo, Chai, Yekun, Muennighoff, Niklas, Tang, Xiangru, Oblokulov, Muhtasham, Akiki, Christopher, Marone, Marc, Mou, Chenghao, Mishra, Mayank, Gu, Alex, Hui, Binyuan, Dao, Tri, Zebaze, Armel, Dehaene, Olivier, Patry, Nicolas, Xu, Canwen, McAuley, Julian, Hu, Han, Scholak, Torsten, Paquet, Sebastien, Robinson, Jennifer, Anderson, Carolyn Jane, Chapados, Nicolas, Patwary, Mostofa, Tajbakhsh, Nima, Jernite, Yacine, Ferrandis, Carlos Muñoz, Zhang, Lingming, Hughes, Sean, Wolf, Thomas, Guha, Arjun, von Werra, Leandro, de Vries, Harm

Published 29-02-2024

“…The BigCode project, an open-scientific collaboration focused on the responsible development of Large Language Models for Code (Code LLMs), introduces…”
Get full text

Journal Article

7

PromptSource: An Integrated Development Environment and Repository for Natural Language Prompts by Bach, Stephen H, Sanh, Victor, Yong, Zheng-Xin, Webson, Albert, Raffel, Colin, Nayak, Nihal V, Sharma, Abheesht, Kim, Taewoon, Bari, M Saiful, Fevry, Thibault, Alyafeai, Zaid, Dey, Manan, Santilli, Andrea, Sun, Zhiqing, Ben-David, Srulik, Xu, Canwen, Chhablani, Gunjan, Wang, Han, Fries, Jason Alan, Al-shaibani, Maged S, Sharma, Shanya, Thakker, Urmish, Almubarak, Khalid, Tang, Xiangru, Radev, Dragomir, Jiang, Mike Tian-Jian, Rush, Alexander M

Published 02-02-2022

“…PromptSource is a system for creating, sharing, and using natural language prompts. Prompts are functions that map an example from a dataset to a natural…”
Get full text

Journal Article

8

SantaCoder: don't reach for the stars by Allal, Loubna Ben, Li, Raymond, Kocetkov, Denis, Mou, Chenghao, Akiki, Christopher, Ferrandis, Carlos Munoz, Muennighoff, Niklas, Mishra, Mayank, Gu, Alex, Dey, Manan, Umapathi, Logesh Kumar, Anderson, Carolyn Jane, Zi, Yangtian, Poirier, Joel Lamy, Schoelkopf, Hailey, Troshin, Sergey, Abulkhanov, Dmitry, Romero, Manuel, Lappert, Michael, De Toni, Francesco, del Río, Bernardo García, Liu, Qian, Bose, Shamik, Bhattacharyya, Urvashi, Zhuo, Terry Yue, Yu, Ian, Villegas, Paulo, Zocca, Marco, Mangrulkar, Sourab, Lansky, David, Nguyen, Huu, Contractor, Danish, Villa, Luis, Li, Jia, Bahdanau, Dzmitry, Jernite, Yacine, Hughes, Sean, Fried, Daniel, Guha, Arjun, de Vries, Harm, von Werra, Leandro

Published 09-01-2023

“…The BigCode project is an open-scientific collaboration working on the responsible development of large language models for code. This tech report describes…”
Get full text

Journal Article

9

StarCoder: may the source be with you by Li, Raymond, Allal, Loubna Ben, Zi, Yangtian, Muennighoff, Niklas, Kocetkov, Denis, Mou, Chenghao, Marone, Marc, Akiki, Christopher, Li, Jia, Chim, Jenny, Liu, Qian, Zheltonozhskii, Evgenii, Zhuo, Terry Yue, Wang, Thomas, Dehaene, Olivier, Davaadorj, Mishig, Lamy-Poirier, Joel, Monteiro, João, Shliazhko, Oleh, Gontier, Nicolas, Meade, Nicholas, Zebaze, Armel, Yee, Ming-Ho, Umapathi, Logesh Kumar, Zhu, Jian, Lipkin, Benjamin, Oblokulov, Muhtasham, Wang, Zhiruo, Murthy, Rudra, Stillerman, Jason, Patel, Siva Sankalp, Abulkhanov, Dmitry, Zocca, Marco, Dey, Manan, Zhang, Zhihan, Fahmy, Nour, Bhattacharyya, Urvashi, Yu, Wenhao, Singh, Swayam, Luccioni, Sasha, Villegas, Paulo, Kunakov, Maxim, Zhdanov, Fedor, Romero, Manuel, Lee, Tony, Timor, Nadav, Ding, Jennifer, Schlesinger, Claire, Schoelkopf, Hailey, Ebert, Jan, Dao, Tri, Mishra, Mayank, Gu, Alex, Robinson, Jennifer, Anderson, Carolyn Jane, Dolan-Gavitt, Brendan, Contractor, Danish, Reddy, Siva, Fried, Daniel, Bahdanau, Dzmitry, Jernite, Yacine, Ferrandis, Carlos Muñoz, Hughes, Sean, Wolf, Thomas, Guha, Arjun, von Werra, Leandro, de Vries, Harm

Published 09-05-2023

“…The BigCode community, an open-scientific collaboration working on the responsible development of Large Language Models for Code (Code LLMs), introduces…”
Get full text

Journal Article

10

The BigScience ROOTS Corpus: A 1.6TB Composite Multilingual Dataset by Laurençon, Hugo, Saulnier, Lucile, Wang, Thomas, Akiki, Christopher, del Moral, Albert Villanova, Scao, Teven Le, Von Werra, Leandro, Mou, Chenghao, Ponferrada, Eduardo González, Nguyen, Huu, Frohberg, Jörg, Šaško, Mario, Lhoest, Quentin, McMillan-Major, Angelina, Dupont, Gerard, Biderman, Stella, Rogers, Anna, allal, Loubna Ben, De Toni, Francesco, Pistilli, Giada, Nguyen, Olivier, Nikpoor, Somaieh, Masoud, Maraim, Colombo, Pierre, de la Rosa, Javier, Villegas, Paulo, Thrush, Tristan, Longpre, Shayne, Nagel, Sebastian, Weber, Leon, Muñoz, Manuel, Zhu, Jian, Van Strien, Daniel, Alyafeai, Zaid, Almubarak, Khalid, Vu, Minh Chien, Gonzalez-Dios, Itziar, Soroa, Aitor, Lo, Kyle, Dey, Manan, Suarez, Pedro Ortiz, Gokaslan, Aaron, Bose, Shamik, Adelani, David, Phan, Long, Tran, Hieu, Yu, Ian, Pai, Suhas, Chim, Jenny, Lepercq, Violette, Ilic, Suzana, Mitchell, Margaret, Luccioni, Sasha Alexandra, Jernite, Yacine

Published 07-03-2023

“…As language models grow ever larger, the need for large-scale high-quality text datasets has never been more pressing, especially in multilingual settings. The…”
Get full text

Journal Article

11

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model by Scao, Teven Le, Fan, Angela, Gallé, Matthias, Webson, Albert, Wang, Thomas, Bekman, Stas, Laurençon, Hugo, Launay, Julien, Raffel, Colin, Simhi, Adi, Alfassy, Amit, Rogers, Anna, Leong, Colin, van Strien, Daniel, Ponferrada, Eduardo González, Levkovizh, Efrat, Benyamina, Hamza, Tran, Hieu, Yu, Ian, Johnson, Isaac, Bhattacharjee, Joydeep, Von Werra, Leandro, Dey, Manan, Jiang, Mike Tian-Jian, Jauhar, Mohammad A, Kassner, Nora, Pyysalo, Sampo, Pai, Suhas, Schick, Timo, Thrush, Tristan, Nikoulina, Vassilina, Laippala, Veronika, Heinzerling, Benjamin, Taşar, Davut Emre, Salesky, Elizabeth, Lee, Wilson Y, Szczechla, Eliza, Chhablani, Gunjan, Wang, Han, Rozen, Jos, Manica, Matteo, Nayak, Nihal, Teehan, Ryan, Albanie, Samuel, Shen, Sheng, Ben-David, Srulik, Kim, Taewoon, Neeraj, Trishala, Roberts, Adam, Tae, Jaesung, Phang, Jason, Press, Ofir, Ryabinin, Max, Peyrounette, Myriam, Patry, Nicolas, Cornette, Pierre, Dettmers, Tim, Ligozat, Anne-Laure, Névéol, Aurélie, Taktasheva, Ekaterina, Kalo, Jan-Christoph, Clive, Jordan, Kim, Najoung, Mirkin, Shachar, Pais, Shani, Pruksachatkun, Yada, Pestana, Amanda, Faranak, Amy, Santos, Ana, HajiHosseini, Azadeh, Ajibade, Benjamin, Saxena, Bharat, Nguyen, Duong A, Rezanejad, Habib, Bhattacharya, Indrani, Nejadgholi, Isar, McKenna, Michael, Burynok, Mykola, Rajani, Nazneen, Samuel, Olanrewaju, Kromann, Rasmus, Shubber, Sarmad, Viguier, Sylvain, Miranda-Escalada, Antonio, Singh, Ayush, Manjavacas, Enrique, Barth, Fabio, Bulchandani, Lokesh, Nezhurina, Marianna, Liu, Minna, Kang, Myungsun, Dahlberg, Nathan, Chandrasekhar, Ramya, Eisenberg, Renata, Canalli, Rodrigo, Schweter, Stefan, Laud, Tanmay, Kainuma, Tomoya, Venkatraman, Yash, Xu, Yingxin

Published 09-11-2022

“…Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these…”
Get full text

Journal Article

12

Multitask Prompted Training Enables Zero-Shot Task Generalization by Sanh, Victor, Webson, Albert, Raffel, Colin, Bach, Stephen H, Sutawika, Lintang, Alyafeai, Zaid, Chaffin, Antoine, Stiegler, Arnaud, Scao, Teven Le, Raja, Arun, Dey, Manan, Bari, M Saiful, Xu, Canwen, Thakker, Urmish, Sharma, Shanya Sharma, Szczechla, Eliza, Kim, Taewoon, Chhablani, Gunjan, Nayak, Nihal, Datta, Debajyoti, Chang, Jonathan, Jiang, Mike Tian-Jian, Wang, Han, Manica, Matteo, Shen, Sheng, Yong, Zheng Xin, Pandey, Harshit, Bawden, Rachel, Wang, Thomas, Neeraj, Trishala, Rozen, Jos, Sharma, Abheesht, Santilli, Andrea, Fevry, Thibault, Fries, Jason Alan, Teehan, Ryan, Bers, Tali, Biderman, Stella, Gao, Leo, Wolf, Thomas, Rush, Alexander M

Published 15-10-2021

“…Large language models have recently been shown to attain reasonable zero-shot generalization on a diverse set of tasks (Brown et al., 2020). It has been…”
Get full text

Journal Article

Search Results - "Dey, Manan"

Assessing Viewer's Mental Health by Detecting Depression in YouTube Videos by Sharma, Shanya, Dey, Manan

How sensitive are translation systems to extra contexts? Mitigating gender bias in Neural Machine Translation models through relevant contexts by Sharma, Shanya, Dey, Manan, Sinha, Koustuv

Evaluating Gender Bias in Natural Language Inference by Sharma, Shanya, Dey, Manan, Sinha, Koustuv

Between words and characters: A Brief History of Open-Vocabulary Modeling and Tokenization in NLP by Mielke, Sabrina J, Alyafeai, Zaid, Salesky, Elizabeth, Raffel, Colin, Dey, Manan, Gallé, Matthias, Raja, Arun, Si, Chenglei, Lee, Wilson Y, Sagot, Benoît, Tan, Samson

Search Tools:

Refine Results

Format

Topic

Language

Year of Publication