11 הפעלת מודלי שפה (LLMs)

אחד מהכלים שהתפתחו מאוד בשנים האחרונות ועושים מהפכה של ממש באופן שבו אנחנו חושבים ועובדים, ובמיוחד למי שעובד עם קוד ועם דאטה, הם כלי בינה מלאכותית גנרטיבית בכלל, ומודלי שפה בפרט (Large Language Models, Generative AI).

במקרה של LLMs מדובר במודלים סטטיסטיים שמאומנים על מקבץ טקסט גדול (נניח לדוגמה מודלים שאומנו על חלק ניכר מהעמודים הזמינים באינטרנט), תוך כדי מעורבות אנושית שנותנת פידבק בתהליך הלמידה של המודל. לא ניכנס בפרק זה לתיאוריה של אופן האימון של מודל שפה, אך סביר להניח שכבר נתקלתם במספר מודלים ושימושים שונים.

יש דוגמאות רבות למודלים שונים שזמינים לשימוש בחינם או בתשלום, של ספקים כגון (רשימה חלקית):

Open AI עם מודלי ChatGPT
Anthropic עם מודלי Claude
Google עם מודלי Gemini
Meta עם מודלי Llama
AWS עם תשתית מודלים בשירות שנקרא (Bedrock)

הרשימה ממשיכה, גדולה מאוד, וגדלה מיום ליום. מרבית המודלים לעיל הם מודלים מבוססים צ’ט (נותנים תחושה של שיחה). בפועל מה שהמודלים עושים זה לתת חיזוי למילה הבאה בכל פעם, וכך הם יוצרים משפטים, שהופכים לפסקאות, ולטקסטים מורכבים. ישנם כמובן מודלים שעושים משימות שונות כמו ליצור תמונה או סרט.

11.1 התקנת `ellmer`

ישנה תיאוריה ופרקטיקה נרחבת על אופן השימוש, ההפעלה, וההתאמה של מודלים לצרכים שונים. בפרק זה נדגים את השימוש בחבילה שנקראת ellmer ומאפשרת להתממשק מתוך R למנעד של מודלים נפוצים. נדגים את השימוש בחבילה באמצעות מודלי Open AI, אך באופן דומה ניתן להשתמש בהתממשקות עם מודלים של ספקים אחרים.

נציין גם שטכניקה נוספת אפשרית היא להשתמש בחבילת openai של R, ואפשר גם להשתמש בחבילות Python ייעודיות על ידי התממשקות של חבילת reticulate שאותה ראינו בפרק הקודם.

כאמור, נמשיך את ההדגמה בחבילת ellmer.

install.packages('ellmer')
library(ellmer)

11.2 הגדרת המפתחות

לפני שאנחנו מתחילים לעבוד עם החבילה, מומלץ לפתוח קובץ עם סיומת Renviron בתיקיית העבודה, שיכיל את המפתחות הנדרשים להפעלה של ה-API. ברגע ש-R עולה הוא יקרא את המשתנה לתוך משתנה סביבה.

ניתן לערוך את הקובץ על ידי שימוש בפקודה הבאה: usethis::edit_r_environ().

הנה דוגמה לקובץ Renviron שמכיל מפתח לשימוש ב-OpenAI:

# Example for a .Renviron file
OPENAI_API_KEY = "***** ADD YOUR SECRET OPENAI KEY HERE *****"

ניתן להוסיף מפתחות לשירותים נוספים בשורה חדשה (לדוגמה עבור מודל קלוד של אנטרופיק, הגדירו משתנה ANTHROPIC_API_KEY).

את ערכיהם של המשתנים הגלובליים ניתן לקרוא על ידי שימוש בפקודה Sys.getenv("OPENAI_API_KEY") אבל בפועל לא תצטרכו כי הפקודות של החבילה יודעות לחפש אותם לבד, ברגע שהם נקראו לסביבה.

כדי להשיג מפתח לשימוש, עליכם לקחת אותו מממשק השליטה של השירות שבו אתם משתמשים (לדוגמה ב-OpenAI צריך לעשות הרשמה קצרה כמפתח developer ולתת מספר כרטיס אשראי. בדרך מקבלים סכום התחלתי מרשים של קרדיטים לשימוש חינמי).

שימוש בקבצי `gitignore`

אם אתם משתמשים ב-git, מומלץ לוודא שיש לכם גם קובץ gitignore, ושהוא מכיל שורה שכתוב בה Renviron על מנת שהקוד הסודי לא יעלה ל-repository בטעות (וזה במיוחד חשוב אם אתם עובדים על repository ציבורי, אחרת עלולים להשתמש במפתחות שלכם ותחויבו על השימושים הללו). להלן דוגמה לקובץ זה, הכוללת המלצות נוספות שקשורות בפרויקטי R:

# Example for .gitignore file  
# Ignore global environment variables 
.Renviron  

# History files 
.Rhistory 
.Rapp.history  

# Session Data files 
.RData  

# User-specific files 
.Ruserdata  

# RStudio internal project files 
.Rproj.user/

כעת נציג דוגמה להפעלת צ’ט ולאחר מכן נסביר בפירוט על הפקודות של החבילה.

11.3 היסטוריה מנוהלת

היופי שבחבילת ellmer זה שהיא מייצרת ממשק מאוד נוח לצ’ט, והיא מנהלת את היסטורית השיחה עבורנו. לדוגמה שתי שיחות דומות, באחת יש יותר הסטוריה מהשניה:

בשתי הדוגמאות אנחנו מאתחלים את הצ’ט עם פרומפט בסיסי (אפילו בסיסי מדי) שאומר למודל לענות כמיטב יכולתו. ההבדל בין הדוגמאות הוא שבצד ימין הוספנו הנחיה “מעכשיו אתה קפטן פיקארד” ואז שאלנו אותו מה התאריך, ולעומת זאת בצד שמאל ישר שאלנו אותו מה התאריך.

בשני המקרים השאלה של “מה התאריך” עומדת, לכאורה, בפני עצמה - כלומר בפקודה נפרדת, אבל ניתן לראות שהאובייקט chat מכיל את ההיסטוריה, ולכן בצד ימין עונה כמו קפטן פיקארד. ה-API כמובן לא מחובר לשעון כלשהו ולכן לא עונה בפועל על השאלה.

כל הרצה נוספת של chat$chat מעלה למעשה את כל ההיסטוריה של השאלות ושל התשובות שניתנו בחזרה ל-API שעמו אנחנו מתקשרים וכך התשובה תמיד שומרת על ההקשר הרלוונטי של השיחה.

chat <- 
    chat_openai(
        "Answer the best you can"
        )
# Using model = "gpt-4o".
chat$chat("מעכשיו אתה קפטן Jean-Luc Picard")
#בכבוד רב, אני מקבל את תפקידי כקפטן ז'אן-לוק
# פיקארד ומברך את כולכם על סיפון האנטרפרייז. 
# האם יש בקשות או שאלות שברצונכם לדון בהן?
# "Make it so!"
chat$chat("איזה יום היום?")
#לצערי, אני לא יכול לגשת למידע בזמן אמת 
# או לדעת את התאריך הנוכחי. 
# אבל תמיד אפשר להיעזר בקומוניקטור שלך 
# או בכל לוח שנה זמין. אם יש עוד משהו שאוכל
# אנא אל תהסס לשאול!

chat <- 
    chat_openai(
        "Answer the best you can"
        )
# Using model = "gpt-4o".
chat$chat("איזה יום היום?")
#אני מצטער, אבל אין לי את האפשרות 
#לבדוק את התאריך הנוכחי.
#אנא בדוק זאת באמצעות 
#מכשיר אחר או לוח שנה.

נעבור להסבר מפורט של השימוש בפקודה chat_openai, כאשר פקודות אחרות בחבילה פועלות בפורמט דומה מאוד רק עם מודלים של חברות אחרות.

11.4 הסבר מפורט ל- `chat_openai`

השלב הראשון בהפעלת הפקודה הוא להגדיר אובייקט שיחה של open ai. ניתן להגדיר מספר אובייקטים שונים למטרות שונות, כאשר כל אובייקט יחזיק הנחיות, מודל, והיסטוריה משל עצמו. לדוגמה:

library(ellmer)
my_chat <- chat_openai(
    system_prompt = 
    "You are an expert in using R, tidyverse, and ggplot2. 
    Keep your responses concise, provide minimal examples.",
    model = "gpt-4o",
)

בפקודה זו הגדרנו אובייקט my_chat שיעשה שימוש במודל “gpt-4o”, וההנחיה הראשונית שלו היא לנהוג כמומחה לשפת R, tidyverse, ו-ggplot2, וכמו כן לשמור על התגובות שלו תמציתיות ועם דוגמאות מינימליות.

כעת כל הפעלה של המודל תתבצע על ידי הפעלת הפונקציה chat שנמצאת בתוך אובייקט my_chat, באופן הבא:

my_chat$chat("Create an example of a chart using mtcars and ggplot2.")

פלט הפקודה יהיה:

Certainly! Here's a simple example of a scatter plot using the `mtcars` 
dataset, showcasing the relationship between miles per gallon (`mpg`) and 
horsepower (`hp`):

```
# Load ggplot2
library(ggplot2)

# Create scatter plot
ggplot(data = mtcars, aes(x = hp, y = mpg)) +
  geom_point() +
  labs(title = "MPG vs Horsepower",
       x = "Horsepower",
       y = "Miles Per Gallon") +
  theme_minimal()
```

This code will create a scatter plot with points representing each car in the 
 The x-axis represents horsepower and the y-axis represents miles per 
gallon.

11.4.1 היסטוריית השיחה

ניתן לצפות בכל ההיסטוריה על ידי קריאה לאובייקט המקורי:

my_chat

<Chat turns=3 tokens=52/142>
── system ──────────────────────────────────────────────────────────────────────
You are an expert in using R, tidyverse, and ggplot2.  Keep your responses 
concise, provide minimal examples.
── user ────────────────────────────────────────────────────────────────────────
Create an example of a chart using mtcars and ggplot2.
── assistant ───────────────────────────────────────────────────────────────────
Certainly! Here's a simple example of a scatter plot using the `mtcars` 
dataset, showcasing the relationship between miles per gallon (`mpg`) and 
horsepower (`hp`):

```r 
# Load ggplot2 library(ggplot2)

# Create scatter plot ggplot(data = mtcars, aes(x = hp, y = mpg)) + 
geom_point() + labs(title = "MPG vs Horsepower", x = "Horsepower", y = "Miles 
Per Gallon") + theme_minimal() 
```

This code will create a scatter plot with points representing each car in the 
dataset. The x-axis represents horsepower and the y-axis represents miles per 
gallon.

11.4.2 חישוב עלויות

מספר הטוקנים (tokens) יכול לשמש להערכה של עלויות ההרצה. טוקנים שקולים למילים או רכיבי שפה אחרים שמתרגמים לפיצ’רים של המודל.

my_chat$tokens()

     input output
[1,]     0      0
[2,]     0      0
[3,]    52    142

לדוגמה, במקרה זה השתמשנו ב-142 טוקנים מסוג פלט (בתשובות המודל) ו-52 טוקנים מסוג קלט, ומכיוון שכל פעם כל היסטוריית הצ’ט נשלחת למודל, הערכים הללו יצטברו:

my_chat$chat("Explain tokens")

In R, particularly within the context of data manipulation and visualization 
the term "token" isn't commonly used. However, in 
and data contexts, "tokens" can refer to different 
concepts:

**Programming Context**: Tokens are the smallest units of code that carry 
keywords, operators, identifiers, and literals. In R, the 
 breaks down code into tokens to analyze and execute it.

**Text Analysis**: In text mining, a token is a single element of a text, 
 a phrase, that is extracted during the process of tokenization.
Tokenization is the process of breaking text data into individual pieces or 
tokens.

3. **Authentication Context**: A token could refer to a security token in API 
acting as a key that provides access to resources or services.

If you meant "tokens" in relation to another specific context, please provide 
more details for a more targeted explanation.

my_chat$tokens()

     input output
[1,]     0      0
[2,]     0      0
[3,]    52    142
[4,]     0      0
[5,]   204    199

בעת כתיבת שורות אלו העלות של gpt-4o היא:

2.5$ למיליון טוקנים של קלט
10$ למיליון טוקנים של פלט

מה שאומר שסך העלות עד כה עומדת על 0.00405$. העלויות יורדות באופן שוטף כל פעם שיוצאים מודלים חדשים, כך שעד שתקראו שורות אלו יכול להיות שהעלויות ירדו בכמה סדרי גודל. כמו כן ישנם מודלים אחרים שכבר היום ניתן להפעיל וזולים במספר סדרי גודל כמו gpt-4o-mini.

מומלץ להתאים את המודל לצורך, נניח במקרה של שימוש מאסיבי, כדאי לבחון ראשית האם המודלים הזולים יתנו ביצועים מספקים.

11.4.3 ניתוח של תרשימים

ניתן להיעזר בפקודות content_image_url, content_image_plot ו-content_image_file על מנת לקודד תמונה ולהעלות אותה כחלק משיחה עם המודל. חלק מהמודלים אומנו כך שגם ידעו להסביר גרפים או תמונות.

במידה ותרצו לקבל הסברים או סיכום של תרשים בצורה אינטראקטיבית (נניח תוך כדי ניתוח), וכבר ייצרתם תרשים, אז ניתן להשתמש ב-content_image_plot ואז התרשים שמוצג בסביבה נלקח ישירות, או לחילופין לקחת אותו מקובץ או url עם אחת משתי הפקודות האחרות.

לדוגמה הנה הסבר לכריכה של הספר:

my_chat$chat("What do you see in this image?", 
             content_image_url("https://www.hebrewr.co.il/images/hebrewr_book_cover.png"))

The image contains text in Hebrew and an illustration of a bird. There's a logo
at the top, and the text appears to be related to using R.

שימושים באפליקציות: הפעלה א-סנכרונית של מודלים

שימוש במודלים עשוי לקחת זמן, לכן אם אנחנו מעוניינים לשלב מודלים בשימושים שדורשים עבודה רציפה ואי-היתקעות של המערכת, עלינו לעבוד באופן א-סנכרוני. חבילת ellmer תומכת גם בהפעלה א-סנכרונית, לדוגמה עם פקודת chat_async, ופקודה זו שימושית כאשר מטמיעים מודלים באפליקציות shiny. עם זאת, לא נדון בהפעלה א-סנכרונית בפרק זה, ובמידת הצורך מומלץ להיעזר בדוגמאות מהתיעוד הרשמי של החבילה.

11.5 תרגילים

תרגיל: שימוש במודל להסבר תרשים

השתמשו באחת מהפונקציות שפועלות על גרפים/תמונות על מנת להסביר את אחד מהתרשימים שהוצגו בפרק 4. באפשרותכם להזין ישירות url מאתר הספר או לשחזר תרשים מסוים באמצעות קוד ולהשתמש בפונקציה content_image_plot.

באפשרותכם להשתמש בקישור הבא:

https://www.hebrewr.co.il/04-visualizations-ggplot2_files/figure-html/pengions%20vis%203%20with%20linear%20regression%20lines-1.png

שמוביל לתרשים:

תרגיל: חילוץ מידע ממחרוזות

השתמשו ב-LLM על מנת לחלץ את שם היצרן מתוך רשימת הרכבים הבאה (המודל צריך להוריד את שם המדינה ולהשאיר רק את שם היצרן):

car_models <- 
   c("סוזוקי-יפן", "פורד ספרד", "ב מ וו בריטניה",
"טויוטה ארהב", "יונדאי צ'כיה", "יונדאי טורקיה",
"פיאט פולין", "אופל-ספרד", "דאציה מרוקו",  
"פולקסווגן פורט", "רנו ד.קוריאה", "מזדה תאילנד",  
"אופל פולין", "גיי.איי.סי סין", "סוזוקי תאילנד",  
"פורד-בלגיה", "אודי מכסיקו", "פורד רומניה",
"פורשה סלובקיה", "מיצובישי הולנד", "דימלרקריזלר-ספ",  
"פיאט סרביה", "קרייזלר מכסיקו", "פורד בריטניה",  
"טויוטה בלגיה", "קיי גי מוביליט", "האמר ג.מ. דרום",  
"פיאט פורטוגל", "ב מ וו מקסיקו", "לנציה פולין",  
"גיאיוואן סין", "סנטרו סין", "טויוטה צרפת",  
"טויוטה יפן", "וולבו שוודיה", "סיאט ספרד",  
"מיצובישי תאילנ", "מקסוס סין", "הונדה בריטניה",  
"מרוטי-סוזוקי", "לנצ'יה", "מ.ג סין", 
"מזארטי איטליה",  "קאדילאק מכסיקו", "הונדה מקסיקו", 
"סיטרואן סלובק",  "מרצדס בנץ הונג", "אורה סין", 
"פיאט תאילנד",  "ב מ וו אוסטריה")

נסו זאת בשתי שיטות:

(1) על ידי הרצה אחת של המודל.

(2) על ידי הרצה של המודל בשלבים (בכל פעם שם אחד מהרשימה).

תרגיל: ניתוח סנטימנט

השתמשו ב-LLM על מנת לנתח את הסנטימנט של כל אחת מההערות המילוליות הבאות.
התוצר הנדרש הוא טבלה שבה שתי עמודות. עמודה אחת היא ההערה עצמה, ועמודה שניה היא הסנטימנט - משתנה מסוג factor בעל שלושה ערכים: Positive, Neutral, Negative.

comments <- c(
  "המכשיר הזה עובד מצוין ואנחנו מאוד מרוצים ממנו.",
  "למכשיר הזה יש הרבה תקלות ולפעמים הוא פשוט מפסיק לעבוד.",
  "המכשיר לא רע, אבל יש לו הרבה מקום לשיפור.",
  "אני ממש אוהב את העיצוב של המקרר החדש הזה.",
  "המכונת כביסה הזו לוקחת הרבה זמן לסיים מחזור עבודה.",
  "המוצר הזה ענה על כל הציפיות שלי ואני ממליץ עליו בחום.",
  "השואב אבק עושה עבודה סבירה, אבל יש לו כוח שאיבה נמוך.",
  "המדיח כלים הזה שקט ויעיל ואני ממש מרוצה ממנו.",
  "המאוורר לא מפיק הרבה רוח וזה די מאכזב.",
  "הטוסטר עובד טוב, אך מחמם לאט מדי לטעמי."
)

נסו זאת באמצעות שני מודלים שונים, והשוו בין תוצאותיהם.

11.6 סיכום

מודלי שפה גדולים הם כלי עוצמתי ומהפכני שמספק יכולות יוצאות דופן לאוטומציה, חיזוי וניתוח טקסט, ומאפשר גישה חדשה לשיפור תהליכי עבודה. בפרק זה סקרנו את היכולות העיקריות של מודלים אלו, הדגמנו את השימוש בחבילת ellmer לעבודה עם מודלים מתוך R, והסברנו את עקרונות השימוש במפתחות API ובניהול היסטוריית שיחות.

השימוש במודלים כמו אלו של OpenAI או Anthropic מדגים כיצד ניתן לשלב בינה מלאכותית בתהליכי עבודה יומיומיים, תוך שמירה על גמישות והתאמה אישית לצרכים שונים. עם התפתחות המהירה של התחום, המודלים הללו ממשיכים להוות כלי מרכזי לעבודה עם דאטה, ניתוח טקסט, ופתרון בעיות מורכבות.

בנוסף, הדגשנו את חשיבות ניהול המידע בצורה מאובטחת ושמירה על פרקטיקות עבודה נכונות, כולל שימוש בקבצי .Renviron ו-.gitignore.

:::

11.1 התקנת ellmer