2024-09-05-sent_arbertv2_ar (#14394)

* Add model 2024-09-07-sent_retromae_msmarco_distill_en * Add model 2024-09-08-analisis_sentimientos_beto_tass_c_en * Add model 2024-09-08-indobert_sentiment_analysis_id * Add model 2024-09-07-spanish_finnish_extra_pipeline_en * Add model 2024-09-04-distilbert_finetuned_squadv2_fuutoru_en * Add model 2024-09-07-whisper_small_kurdish_sorani_10_pipeline_ku * Add model 2024-09-08-bert_imdb_pipeline_en * Add model 2024-09-08-linkbert_base_en * Add model 2024-09-07-burmese_awesome_qa_model_ravinderbrai_en * Add model 2024-09-08-custommodel_yelp_hanyundudddd_pipeline_en * Add model 2024-09-08-classification_model_mtebad_pipeline_en * Add model 2024-09-08-has_the_doctor_specified_whether_the_patient_can_belarusian_seen_heard_bert_first512_pipeline_en * Add model 2024-09-07-burmese_awesome_qa_model_rahulcdeo_en * Add model 2024-09-08-whisper_small_finetuned_common_voice_marathi_marh_mr * Add model 2024-09-06-danish_distilbert_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_emotion_bistudent_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_emotion_talzoomanzoo_en * Add model 2024-09-08-distillbert_sentiment_analysis_en * Add model 2024-09-08-lenu_ewe_pipeline_en * Add model 2024-09-08-roberta_qa_QA_for_Event_Extraction_en * Add model 2024-09-08-mpnet_twitter_freq100_pipeline_en * Add model 2024-09-07-qa_ccc_model_pipeline_en * Add model 2024-09-07-burmese_awesome_qa_model_vikas12061995_pipeline_en * Add model 2024-09-08-setfit_model_ireland_binary_label1_epochs2_feb_28_2023_en * Add model 2024-09-07-lab1_random_sfliao_pipeline_en * Add model 2024-09-08-psais_multi_qa_mpnet_base_dot_v1_8shot_en * Add model 2024-09-08-all_mpnet_base_v2_navteca_en * Add model 2024-09-08-all_mpnet_base_v2_lr_1e_8_margin_5_epoch_3_en * Add model 2024-09-07-v2_mrcl0ud_pipeline_en * Add model 2024-09-08-setfit_model_ireland_3labels_balanced_data_en * Add model 2024-09-08-mpnet_base_nli_matryoshka_yoshinori_sano_en * Add model 2024-09-08-facets_gpt_35_pipeline_en * Add model 2024-09-08-all_mpnet_janet_10k_v1_en * Add model 2024-09-08-all_mpnet_janet_10k_v1_pipeline_en * Add model 2024-09-06-bert_base_multilingual_cased_finetuned_amharic_xx * Add model 2024-09-08-semanlink_all_mpnet_base_v2_en * Add model 2024-09-08-amazonpolarity_fewshot_en * Add model 2024-09-07-phowhisper_tiny_vinai_vi * Add model 2024-09-04-distil_bert_docred_ner_en * Add model 2024-09-07-arabic_bert_model_ar * Add model 2024-09-07-test_demo_qa_en * Add model 2024-09-08-opus_maltese_english_arabic_evaluated_english_tonga_tonga_islands_arabic_2000instancesopus_leaningrate2e_05_batchsize8_11epoch_3_pipeline_en * Add model 2024-09-06-pii_roberta_large_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_malagasy_en * Add model 2024-09-08-test999_en * Add model 2024-09-02-burmese_awesome_model_20wds_en * Add model 2024-09-07-burmese_awesome_model_akash24_en * Add model 2024-09-08-test999_pipeline_en * Add model 2024-09-07-distilbert_base_uncased_finetuned_squad_d5716d28_osanseviero_en * Add model 2024-09-05-burmese_awesome_wnut_place_pipeline_en * Add model 2024-09-08-sent_xlm_roberta_base_finetuned_questions_en * Add model 2024-09-06-burmese_awesome_qa_model_robinsh2023_pipeline_en * Add model 2024-09-07-whisper_gujarati_small_pipeline_gu * Add model 2024-09-07-llama_model_en * Add model 2024-09-04-deberta_classifier_feedback_1024_pseudo_final_pipeline_en * Add model 2024-09-06-opus_maltese_russian_english_end_tonga_tonga_islands_end_russian_tonga_tonga_islands_english_en * Add model 2024-09-05-qa_synth_02_oct_with_finetune_1_1_en * Add model 2024-09-07-distilbert_finetuned_squadv2_thangduong0509_en * Add model 2024-09-04-roberta_finetuned_subjqa_movies_2_soumiknayak_pipeline_en * Add model 2024-09-07-marian_finetuned_combined_dataset_1_1_pipeline_en * Add model 2024-09-08-bert_imdb_en * Add model 2024-09-07-run1_pipeline_en * Add model 2024-09-07-distilbert_base_uncased_finetuned_ner_shashank612_pipeline_en * Add model 2024-09-07-distilbert_base_uncased_finetuned_squad_injustice_en * Add model 2024-09-06-distilbert_base_cased_finetuned_chunk_2_pipeline_en * Add model 2024-09-06-burmese_awesome_wnut_jpr_gonzalezrostani_en * Add model 2024-09-07-greeklegalroberta_v2_pipeline_en * Add model 2024-09-08-bert_base_yelp_reviews_pipeline_en * Add model 2024-09-06-sent_neural_cherche_sparse_embed_pipeline_en * Add model 2024-09-07-distilbert_base_uncased_finetuned_squad_devsick_pipeline_en * Add model 2024-09-07-distilbert_base_uncased_finetuned_squad_devsick_en * Add model 2024-09-06-distilbert_finetuned_ai4privacy_v2_pipeline_en * Add model 2024-09-06-content_en * Add model 2024-09-08-cpu_netzero_classifier_pipeline_en * Add model 2024-09-06-all_mpnet_base_v2_bioasq_matryoshka_pipeline_en * Add model 2024-09-07-distil_train_token_classification_nepal_bhasa_en * Add model 2024-09-08-gal_sayula_popoluca_iwcg_4_en * Add model 2024-09-08-xlm_roberta_base_finetuned_wikiann_hindi_en * Add model 2024-09-08-xlm_roberta_base_finetuned_wikiann_hindi_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_italian_aiventurer_en * Add model 2024-09-07-cuad_distil_governing_law_08_28_v1_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_all_pockypocky_pipeline_en * Add model 2024-09-08-luganda_ner_v1_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_italian_aiventurer_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_german_french_buruzaemon_pipeline_en * Add model 2024-09-06-sungbeom_whisper_small_korean_set9_pipeline_ko * Add model 2024-09-05-turkish_base_bert_capitalization_correction_pipeline_tr * Add model 2024-09-08-gal_enptsp_xlm_r_gl * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_german_nitin1690_en * Add model 2024-09-08-multilingual_xlm_roberta_for_ner_c4n11_xx * Add model 2024-09-07-fresh_model_uncased_pipeline_en * Add model 2024-09-07-distilbert_base_uncased_squad2_lora_merged_jeukhwang_en * Add model 2024-09-08-gal_portuguese_xlm_r_pipeline_gl * Add model 2024-09-08-opus_maltese_english_japanese_finetuned_english_tonga_tonga_islands_japanese_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_french_goldenk_en * Add model 2024-09-07-cross_all_bs320_vanilla_finetuned_webnlg2020_metric_average_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_german_fernweh23_pipeline_en * Add model 2024-09-07-setfit_model_independence_labelintl_epochs2_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_italian_leosol_en * Add model 2024-09-08-cat_ner_xlmr_4_en * Add model 2024-09-08-cross_all_bs192_hardneg_finetuned_webnlg2020_relevance_en * Add model 2024-09-08-setfit_model_ireland_3labels_balanced_data_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_all_likejazz_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_all_likejazz_en * Add model 2024-09-06-norwegian_bokml_whisper_small_verbatim_nbailabbeta_pipeline_no * Add model 2024-09-07-lm_ner_skills_extractor_bert_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_italian_aaa01101312_pipeline_en * Add model 2024-09-07-burmese_awesome_qa_model_markchiing_en * Add model 2024-09-08-afro_xlmr_base_finetuned_kintweetsb_en * Add model 2024-09-08-xlm_roberta_base_word_shopsign_nepal_bhasa_pipeline_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_english_iis2009002_pipeline_en * Add model 2024-09-07-whisper_small_hindi_drinktoomuchsax_en * Add model 2024-09-07-burmese_awesome_wnut_model_halikuralde2_pipeline_en * Add model 2024-09-07-sent_turkish_tiny_bert_uncased_tr * Add model 2024-09-08-recommend_songs_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_emotion_niwang2024_en * Add model 2024-09-08-classification_model_sushant22_en * Add model 2024-09-08-intent_classifier_frana9812_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_emotion_with_annotated_by_gpt35_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_emotion_with_annotated_by_gpt35_en * Add model 2024-09-08-trainer_output_dir_pipeline_en * Add model 2024-09-08-cm124057_01_en * Add model 2024-09-08-agnews_padding60model_en * Add model 2024-09-08-distilbert_coarse5_js_1_1_pipeline_en * Add model 2024-09-08-distilbert_coarse5_js_1_1_en * Add model 2024-09-08-bert_based_uncased_finetuned_imdb_en * Add model 2024-09-08-distilbert_tweet_pipeline_en * Add model 2024-09-08-multidim_default_template_en * Add model 2024-09-08-stego_classifier_checkpoint_epoch_10_2024_07_26_14_26_52_en * Add model 2024-09-07-bert_base_dutch_cased_finetuned_mbert_finetuned_ner_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_emotion_schnatz65_pipeline_en * Add model 2024-09-07-ner_newsagency_bert_french_pipeline_fr * Add model 2024-09-06-nusabert_base_pipeline_en * Add model 2024-09-08-bertoslav_limited_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_xxxxxcz_en * Add model 2024-09-07-wolof_finetuned_ner_pipeline_en * Add model 2024-09-08-usclm_distilbert_base_uncased_mk1_en * Add model 2024-09-08-distilbert_base_cased_finetuned_imdb_shindc_en * Add model 2024-09-08-distilbert_base_cased_finetuned_imdb_shindc_pipeline_en * Add model 2024-09-08-distilbert_base_english_greek_modern_russian_cased_pipeline_en * Add model 2024-09-06-xlm_roberta_base_panx_dataset_russian_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_adrien35_pipeline_en * Add model 2024-09-08-maskedlm_finetuned_imdb_en * Add model 2024-09-08-distilbert_base_cased_distilbert_en * Add model 2024-09-08-imdb_distilbert_apoorvaec1030_en * Add model 2024-09-08-updated_distilbert_stance_detection_pipeline_en * Add model 2024-09-06-burmese_awesome_qa_model_nandyala12_en * Add model 2024-09-08-category_1_delivery_cancellation_distilbert_base_uncased_distilled_squad_v1_en * Add model 2024-09-08-quality_model_apr3_en * Add model 2024-09-08-joo_en * Add model 2024-09-08-resume_sentence_classifier_en * Add model 2024-09-08-clasificadorcorreosoportedistilespanol_pipeline_en * Add model 2024-09-08-hw_1_aia_tclin_en * Add model 2024-09-08-hw_1_aia_tclin_pipeline_en * Add model 2024-09-08-depression_detection_model_en * Add model 2024-09-08-distilbert_base_multilingual_cased_regression_finetuned_ptt_pipeline_xx * Add model 2024-09-08-trainer1f_pipeline_en * Add model 2024-09-08-test_trainer4_en * Add model 2024-09-07-nuclear_medicine_daroberta_en * Add model 2024-09-08-distilbert_base_uncased_odm_zphr_0st13sd_ut72ut1large13pfxnf_simsp400_clean200_pipeline_en * Add model 2024-09-08-distilbert_movie_review_sentiment_classifier_3_pipeline_en * Add model 2024-09-08-tmp_trainer_ubermenchh_pipeline_en * Add model 2024-09-07-whisper_small_english_atco2_asr_pipeline_en * Add model 2024-09-08-all_mpnet_base_v2_topic_abstract_similarity_en * Add model 2024-09-08-xtremedistil_l6_h384_uncased_en * Add model 2024-09-08-xlm_roberta_base_finetuned_panx_german_french_alkampfer_en * Add model 2024-09-05-sbert_punc_case_russian_pipeline_ru * Add model 2024-09-08-psais_multi_qa_mpnet_base_dot_v1_8shot_pipeline_en * Add model 2024-09-08-setfit_model_ireland_4labels_unbalanced_data_3epochs_en * Add model 2024-09-08-xlm_roberta_base_word_shopsign_nepal_bhasa_en * Add model 2024-09-04-sent_marbert_ar * Add model 2024-09-06-paws_x_xlm_r_only_german_en * Add model 2024-09-08-twitter_roberta_base_topic_latest_en * Add model 2024-09-08-platzi_en * Add model 2024-09-08-roberta_base_emotion_pysentimiento_pipeline_en * Add model 2024-09-08-best_model_yelp_polarity_16_13_en * Add model 2024-09-08-roberta_soft_llm_multip_pipeline_en * Add model 2024-09-08-lexuz1_pipeline_en * Add model 2024-09-08-auro_4_pipeline_en * Add model 2024-09-08-auro_4_en * Add model 2024-09-08-tweetcat_pipeline_en * Add model 2024-09-08-roberta_news_classification_aparnaullas_pipeline_en * Add model 2024-09-08-bertin_roberta_fine_tuned_text_classification_slovene_data_augmentation_ds_en * Add model 2024-09-08-n2c2_soap_entailment_pipeline_en * Add model 2024-09-08-hw1_eva1209_en * Add model 2024-09-08-inde_4_en * Add model 2024-09-08-sota_4_pipeline_en * Add model 2024-09-08-testing_en * Add model 2024-09-03-n_roberta_twitterfin_padding60model_en * Add model 2024-09-08-w2l_en * Add model 2024-09-08-n_roberta_imdb_padding10model_pipeline_en * Add model 2024-09-08-trecdl22_crossencoder_roberta_pipeline_en * Add model 2024-09-08-w2l_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_emotion_lilvoda_en * Add model 2024-09-06-question_answering_tutorial_practice_en * Add model 2024-09-07-qa_model_fsghs_pipeline_en * Add model 2024-09-06-xlm_roberta_base_finetuned_panx_german_francos_pipeline_en * Add model 2024-09-07-setfit_model_independence_labelintl_epochs2_en * Add model 2024-09-06-burmese_awesome_qa_model_yangyangsong_pipeline_en * Add model 2024-09-07-roberta_large_genia_ner_pipeline_en * Add model 2024-09-07-opus_maltese_english_romanian_finetuned_english_tonga_tonga_islands_romanian_anhtuanta_pipeline_en * Add model 2024-09-08-xlm_twitter_politics_sentiment_en * Add model 2024-09-08-xlm_roberta_sentiment_romanurdu_en * Add model 2024-09-08-rulebert_v0_4_k0_pipeline_it * Add model 2024-09-08-portuguese_up_xlmr_oneshot_falsetrue_0_2_best_en * Add model 2024-09-07-sent_tech_roberta_pipeline_vi * Add model 2024-09-03-finer_ord_transformers_2_en * Add model 2024-09-08-portuguese_up_xlmr_oneshot_falsetrue_0_2_best_pipeline_en * Add model 2024-09-08-xlm_roberta_base_tweet_sentiment_spanish_trimmed_spanish_60000_pipeline_en * Add model 2024-09-08-khmer_text_classification_roberta_km * Add model 2024-09-08-khmer_text_classification_roberta_pipeline_km * Add model 2024-09-08-xlm_roberta_base_final_mixed_aug_insert_bert_2_en * Add model 2024-09-08-mlm_jjk_subtitle_en * Add model 2024-09-08-xlmroberta_classifier_autonlp_fake_news_detection_system_29906863_hi * Add model 2024-09-07-biomedroberta_finetuned_valid_testing_0_0001_16_pipeline_en * Add model 2024-09-08-xlmroberta_classifier_autonlp_fake_news_detection_system_29906863_pipeline_hi * Add model 2024-09-08-predict_perception_xlmr_focus_assassin_en * Add model 2024-09-08-mminilm_l6_v2_english_portuguese_msmarco_v1_pipeline_pt * Add model 2024-09-08-finance_news_classifier_en * Add model 2024-09-08-babyberta_wikipedia1_2_5_with_masking_run2_finetuned_qasrl_pipeline_en * Add model 2024-09-08-stego_classifier_checkpoint_epoch_0_2024_07_26_11_37_42_en * Add model 2024-09-08-xlm_roberta_longformer_base_4096_xnli_french_3_classes_rua_wl_3_classes_fr * Add model 2024-09-07-roberta_self_trained_pipeline_en * Add model 2024-09-08-stego_classifier_checkpoint_epoch_0_2024_07_26_11_37_42_pipeline_en * Add model 2024-09-07-distilbert_finetuned_ner_veronica1608_pipeline_en * Add model 2024-09-07-mpnet_base_natural_questions_mnsrl_pipeline_en * Add model 2024-09-08-argureviews_specificity_roberta_v1_pipeline_en * Add model 2024-09-08-xlmroberta_classifier_deoffxlmr_mono_tamil_ta * Add model 2024-09-08-xlmroberta_classifier_deoffxlmr_mono_tamil_pipeline_ta * Add model 2024-09-08-test_trainer4_pipeline_en * Add model 2024-09-07-sent_telugu_bert_te * Add model 2024-09-08-multidim_romansh_reg_avg_balanced_default_template_en * Add model 2024-09-07-lab1_finetuning_daanjiri_pipeline_en * Add model 2024-09-08-sent_norwegian_bokml_roberta_base_scandi_1e4_en * Add model 2024-09-07-roberta_base_finetuned_neg_pipeline_en * Add model 2024-09-08-platzi_pipeline_en * Add model 2024-09-08-romanurduclassification_pipeline_en * Add model 2024-09-08-albert_persian_farsi_base_v2_sentiment_digikala_pipeline_fa * Add model 2024-09-08-distilbert_base_uncased_finetuned_streamers_accelerate_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_majkeldcember_en * Add model 2024-09-08-distilbert_masking_1perc_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_marcosautuori_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_ellieburton_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_dylettante_pipeline_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_pbwinter_en * Add model 2024-09-08-distilbert_base_uncased_finetuned_imdb_lidiapierre_en * Add model 2024-09-08-atte_2_pipeline_en * Add model 2024-09-07-r_t_sms_lm_pipeline_en * Add model 2024-09-07-qa_iiitdmj_testing_en * Add model 2024-09-07-distilbert_base_uncased_finetuned_clinc_jeremygf_en --------- Co-authored-by: ahmedlone127 <ahmedlone127@gmail.com>
JohnSnowLabs · Sep 8, 2024 · 3892863 · 3892863
1 parent ab101a6
commit 3892863
Show file tree

Hide file tree

Showing 4,274 changed files with 348,562 additions and 0 deletions.
diff --git a/docs/_posts/ahmedlone127/2024-09-01-deberta_v3_base_company_names_en.md b/docs/_posts/ahmedlone127/2024-09-01-deberta_v3_base_company_names_en.md
@@ -0,0 +1,94 @@
+---
+layout: model
+title: English deberta_v3_base_company_names DeBertaForTokenClassification from nbroad
+author: John Snow Labs
+name: deberta_v3_base_company_names
+date: 2024-09-01
+tags: [en, open_source, onnx, token_classification, deberta, ner]
+task: Named Entity Recognition
+language: en
+edition: Spark NLP 5.4.2
+spark_version: 3.0
+supported: true
+engine: onnx
+annotator: DeBertaForTokenClassification
+article_header:
+  type: cover
+use_language_switcher: "Python-Scala-Java"
+---
+
+## Description
+
+Pretrained DeBertaForTokenClassification model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP.`deberta_v3_base_company_names` is a English model originally trained by nbroad.
+
+{:.btn-box}
+<button class="button button-orange" disabled>Live Demo</button>
+<button class="button button-orange" disabled>Open in Colab</button>
+[Download](https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/deberta_v3_base_company_names_en_5.4.2_3.0_1725197551202.zip){:.button.button-orange.button-orange-trans.arr.button-icon}
+[Copy S3 URI](s3://auxdata.johnsnowlabs.com/public/models/deberta_v3_base_company_names_en_5.4.2_3.0_1725197551202.zip){:.button.button-orange.button-orange-trans.button-icon.button-copy-s3}
+
+## How to use
+
+
+
+<div class="tabs-box" markdown="1">
+{% include programmingLanguageSelectScalaPythonNLU.html %}
+```python
+
+documentAssembler = DocumentAssembler() \
+    .setInputCol('text') \
+    .setOutputCol('document')
+
+tokenizer = Tokenizer() \
+    .setInputCols(['document']) \
+    .setOutputCol('token')
+
+tokenClassifier  = DeBertaForTokenClassification.pretrained("deberta_v3_base_company_names","en") \
+     .setInputCols(["documents","token"]) \
+     .setOutputCol("ner")
+
+pipeline = Pipeline().setStages([documentAssembler, tokenizer, tokenClassifier])
+data = spark.createDataFrame([["I love spark-nlp"]]).toDF("text")
+pipelineModel = pipeline.fit(data)
+pipelineDF = pipelineModel.transform(data)
+
+```
+```scala
+
+val documentAssembler = new DocumentAssembler()
+    .setInputCols("text")
+    .setOutputCols("document")
+
+val tokenizer = new Tokenizer()
+    .setInputCols("document")
+    .setOutputCol("token")
+
+val tokenClassifier = DeBertaForTokenClassification.pretrained("deberta_v3_base_company_names", "en")
+    .setInputCols(Array("documents","token")) 
+    .setOutputCol("ner") 
+
+val pipeline = new Pipeline().setStages(Array(documentAssembler, tokenizer, tokenClassifier))
+val data = Seq("I love spark-nlp").toDS.toDF("text")
+val pipelineModel = pipeline.fit(data)
+val pipelineDF = pipelineModel.transform(data)
+
+```
+</div>
+
+{:.model-param}
+## Model Information
+
+{:.table-model}
+|---|---|
+|Model Name:|deberta_v3_base_company_names|
+|Compatibility:|Spark NLP 5.4.2+|
+|License:|Open Source|
+|Edition:|Official|
+|Input Labels:|[document, token]|
+|Output Labels:|[ner]|
+|Language:|en|
+|Size:|661.8 MB|
+
+## References
+
+https://huggingface.co/nbroad/deberta-v3-base-company-names
diff --git a/docs/_posts/ahmedlone127/2024-09-01-deberta_v3_large__sst2__train_8_2_en.md b/docs/_posts/ahmedlone127/2024-09-01-deberta_v3_large__sst2__train_8_2_en.md
@@ -0,0 +1,94 @@
+---
+layout: model
+title: English deberta_v3_large__sst2__train_8_2 DeBertaForSequenceClassification from SetFit
+author: John Snow Labs
+name: deberta_v3_large__sst2__train_8_2
+date: 2024-09-01
+tags: [en, open_source, onnx, sequence_classification, deberta]
+task: Text Classification
+language: en
+edition: Spark NLP 5.4.2
+spark_version: 3.0
+supported: true
+engine: onnx
+annotator: DeBertaForSequenceClassification
+article_header:
+  type: cover
+use_language_switcher: "Python-Scala-Java"
+---
+
+## Description
+
+Pretrained DeBertaForSequenceClassification model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP.`deberta_v3_large__sst2__train_8_2` is a English model originally trained by SetFit.
+
+{:.btn-box}
+<button class="button button-orange" disabled>Live Demo</button>
+<button class="button button-orange" disabled>Open in Colab</button>
+[Download](https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/deberta_v3_large__sst2__train_8_2_en_5.4.2_3.0_1725182599185.zip){:.button.button-orange.button-orange-trans.arr.button-icon}
+[Copy S3 URI](s3://auxdata.johnsnowlabs.com/public/models/deberta_v3_large__sst2__train_8_2_en_5.4.2_3.0_1725182599185.zip){:.button.button-orange.button-orange-trans.button-icon.button-copy-s3}
+
+## How to use
+
+
+
+<div class="tabs-box" markdown="1">
+{% include programmingLanguageSelectScalaPythonNLU.html %}
+```python
+
+documentAssembler = DocumentAssembler() \
+    .setInputCol('text') \
+    .setOutputCol('document')
+
+tokenizer = Tokenizer() \
+    .setInputCols(['document']) \
+    .setOutputCol('token')
+
+sequenceClassifier  = DeBertaForSequenceClassification.pretrained("deberta_v3_large__sst2__train_8_2","en") \
+     .setInputCols(["documents","token"]) \
+     .setOutputCol("class")
+
+pipeline = Pipeline().setStages([documentAssembler, tokenizer, sequenceClassifier])
+data = spark.createDataFrame([["I love spark-nlp"]]).toDF("text")
+pipelineModel = pipeline.fit(data)
+pipelineDF = pipelineModel.transform(data)
+
+```
+```scala
+
+val documentAssembler = new DocumentAssembler()
+    .setInputCols("text")
+    .setOutputCols("document")
+
+val tokenizer = new Tokenizer()
+    .setInputCols(Array("document"))
+    .setOutputCol("token")
+
+val sequenceClassifier = DeBertaForSequenceClassification.pretrained("deberta_v3_large__sst2__train_8_2", "en")
+    .setInputCols(Array("documents","token")) 
+    .setOutputCol("class") 
+
+val pipeline = new Pipeline().setStages(Array(documentAssembler, tokenizer, sequenceClassifier))
+val data = Seq("I love spark-nlp").toDS.toDF("text")
+val pipelineModel = pipeline.fit(data)
+val pipelineDF = pipelineModel.transform(data)
+
+```
+</div>
+
+{:.model-param}
+## Model Information
+
+{:.table-model}
+|---|---|
+|Model Name:|deberta_v3_large__sst2__train_8_2|
+|Compatibility:|Spark NLP 5.4.2+|
+|License:|Open Source|
+|Edition:|Official|
+|Input Labels:|[document, token]|
+|Output Labels:|[class]|
+|Language:|en|
+|Size:|1.5 GB|
+
+## References
+
+https://huggingface.co/SetFit/deberta-v3-large__sst2__train-8-2
diff --git a/docs/_posts/ahmedlone127/2024-09-01-expe_1_en.md b/docs/_posts/ahmedlone127/2024-09-01-expe_1_en.md
@@ -0,0 +1,94 @@
+---
+layout: model
+title: English expe_1 RoBertaForSequenceClassification from BaronSch
+author: John Snow Labs
+name: expe_1
+date: 2024-09-01
+tags: [en, open_source, onnx, sequence_classification, roberta]
+task: Text Classification
+language: en
+edition: Spark NLP 5.5.0
+spark_version: 3.0
+supported: true
+engine: onnx
+annotator: RoBertaForSequenceClassification
+article_header:
+  type: cover
+use_language_switcher: "Python-Scala-Java"
+---
+
+## Description
+
+Pretrained RoBertaForSequenceClassification model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP.`expe_1` is a English model originally trained by BaronSch.
+
+{:.btn-box}
+<button class="button button-orange" disabled>Live Demo</button>
+<button class="button button-orange" disabled>Open in Colab</button>
+[Download](https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/expe_1_en_5.5.0_3.0_1725212357824.zip){:.button.button-orange.button-orange-trans.arr.button-icon}
+[Copy S3 URI](s3://auxdata.johnsnowlabs.com/public/models/expe_1_en_5.5.0_3.0_1725212357824.zip){:.button.button-orange.button-orange-trans.button-icon.button-copy-s3}
+
+## How to use
+
+
+
+<div class="tabs-box" markdown="1">
+{% include programmingLanguageSelectScalaPythonNLU.html %}
+```python
+
+documentAssembler = DocumentAssembler() \
+    .setInputCol('text') \
+    .setOutputCol('document')
+
+tokenizer = Tokenizer() \
+    .setInputCols(['document']) \
+    .setOutputCol('token')
+
+sequenceClassifier  = RoBertaForSequenceClassification.pretrained("expe_1","en") \
+     .setInputCols(["documents","token"]) \
+     .setOutputCol("class")
+
+pipeline = Pipeline().setStages([documentAssembler, tokenizer, sequenceClassifier])
+data = spark.createDataFrame([["I love spark-nlp"]]).toDF("text")
+pipelineModel = pipeline.fit(data)
+pipelineDF = pipelineModel.transform(data)
+
+```
+```scala
+
+val documentAssembler = new DocumentAssembler()
+    .setInputCols("text")
+    .setOutputCols("document")
+
+val tokenizer = new Tokenizer()
+    .setInputCols(Array("document"))
+    .setOutputCol("token")
+
+val sequenceClassifier = RoBertaForSequenceClassification.pretrained("expe_1", "en")
+    .setInputCols(Array("documents","token")) 
+    .setOutputCol("class") 
+
+val pipeline = new Pipeline().setStages(Array(documentAssembler, tokenizer, sequenceClassifier))
+val data = Seq("I love spark-nlp").toDS.toDF("text")
+val pipelineModel = pipeline.fit(data)
+val pipelineDF = pipelineModel.transform(data)
+
+```
+</div>
+
+{:.model-param}
+## Model Information
+
+{:.table-model}
+|---|---|
+|Model Name:|expe_1|
+|Compatibility:|Spark NLP 5.5.0+|
+|License:|Open Source|
+|Edition:|Official|
+|Input Labels:|[document, token]|
+|Output Labels:|[class]|
+|Language:|en|
+|Size:|468.5 MB|
+
+## References
+
+https://huggingface.co/BaronSch/Expe_1
diff --git a/docs/_posts/ahmedlone127/2024-09-01-imdb_microsoft_deberta_v3_large_seed_1_en.md b/docs/_posts/ahmedlone127/2024-09-01-imdb_microsoft_deberta_v3_large_seed_1_en.md
@@ -0,0 +1,94 @@
+---
+layout: model
+title: English imdb_microsoft_deberta_v3_large_seed_1 DeBertaForSequenceClassification from utahnlp
+author: John Snow Labs
+name: imdb_microsoft_deberta_v3_large_seed_1
+date: 2024-09-01
+tags: [en, open_source, onnx, sequence_classification, deberta]
+task: Text Classification
+language: en
+edition: Spark NLP 5.5.0
+spark_version: 3.0
+supported: true
+engine: onnx
+annotator: DeBertaForSequenceClassification
+article_header:
+  type: cover
+use_language_switcher: "Python-Scala-Java"
+---
+
+## Description
+
+Pretrained DeBertaForSequenceClassification model, adapted from Hugging Face and curated to provide scalability and production-readiness using Spark NLP.`imdb_microsoft_deberta_v3_large_seed_1` is a English model originally trained by utahnlp.
+
+{:.btn-box}
+<button class="button button-orange" disabled>Live Demo</button>
+<button class="button button-orange" disabled>Open in Colab</button>
+[Download](https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/imdb_microsoft_deberta_v3_large_seed_1_en_5.5.0_3.0_1725209314777.zip){:.button.button-orange.button-orange-trans.arr.button-icon}
+[Copy S3 URI](s3://auxdata.johnsnowlabs.com/public/models/imdb_microsoft_deberta_v3_large_seed_1_en_5.5.0_3.0_1725209314777.zip){:.button.button-orange.button-orange-trans.button-icon.button-copy-s3}
+
+## How to use
+
+
+
+<div class="tabs-box" markdown="1">
+{% include programmingLanguageSelectScalaPythonNLU.html %}
+```python
+
+documentAssembler = DocumentAssembler() \
+    .setInputCol('text') \
+    .setOutputCol('document')
+
+tokenizer = Tokenizer() \
+    .setInputCols(['document']) \
+    .setOutputCol('token')
+
+sequenceClassifier  = DeBertaForSequenceClassification.pretrained("imdb_microsoft_deberta_v3_large_seed_1","en") \
+     .setInputCols(["documents","token"]) \
+     .setOutputCol("class")
+
+pipeline = Pipeline().setStages([documentAssembler, tokenizer, sequenceClassifier])
+data = spark.createDataFrame([["I love spark-nlp"]]).toDF("text")
+pipelineModel = pipeline.fit(data)
+pipelineDF = pipelineModel.transform(data)
+
+```
+```scala
+
+val documentAssembler = new DocumentAssembler()
+    .setInputCols("text")
+    .setOutputCols("document")
+
+val tokenizer = new Tokenizer()
+    .setInputCols(Array("document"))
+    .setOutputCol("token")
+
+val sequenceClassifier = DeBertaForSequenceClassification.pretrained("imdb_microsoft_deberta_v3_large_seed_1", "en")
+    .setInputCols(Array("documents","token")) 
+    .setOutputCol("class") 
+
+val pipeline = new Pipeline().setStages(Array(documentAssembler, tokenizer, sequenceClassifier))
+val data = Seq("I love spark-nlp").toDS.toDF("text")
+val pipelineModel = pipeline.fit(data)
+val pipelineDF = pipelineModel.transform(data)
+
+```
+</div>
+
+{:.model-param}
+## Model Information
+
+{:.table-model}
+|---|---|
+|Model Name:|imdb_microsoft_deberta_v3_large_seed_1|
+|Compatibility:|Spark NLP 5.5.0+|
+|License:|Open Source|
+|Edition:|Official|
+|Input Labels:|[document, token]|
+|Output Labels:|[class]|
+|Language:|en|
+|Size:|1.6 GB|
+
+## References
+
+https://huggingface.co/utahnlp/imdb_microsoft_deberta-v3-large_seed-1