Large improvement to (model-dependent) token utilization

And update README.md
2026-05-10 21:50:14 -07:00 · 2023-04-03 04:03:12 -07:00
parent 23a3185696
commit 89f5802e8d
7 changed files with 32 additions and 17 deletions
@@ -26,10 +26,14 @@ Or click fork & run on Vercel
 🚨 **We added cool new features to the app!** (bare-bones
 was [466a36](https://github.com/enricoros/nextjs-chatgpt-app/tree/466a3667a48060d406d60943af01fe26366563fb))

+- [x] _NEW 04.03_ 🎉 **PDF import** 📄🔀🧠 (fredliubojin) <- "ask questions to a PDF!" 🤯
+- [x] _NEW 04.03_ 🎉 **NEW 04.03** Tokens utilization 📊 [WIP]
+  <p><a href="docs/feature_token_counter.png"><img src="docs/feature_token_counter.png" width='300' alt="Token Counters"/></a></p> 
+- [x] _NEW 04.02_ 🎉 **Markdown rendering** 🎨 (nilshulth) [WIP]
 - [x] 🎉 **NEW 04.01** Typing Avatars
  <p><a href="docs/recording_0401.gif"><img src="docs/recording_0401.gif" width='700' alt="New Typing Avatars"/></a></p>
 - [x] 🎉 **NEW 03.31** Publish & share chats to paste.gg 📥
-  <p><a href="docs/screenshot_export_example1.png"><img src="docs/screenshot_export_example1.png" width='300' alt="Export chats"/></a></p>
+  <p><a href="docs/screenshot_export_example1.png"><img src="docs/screenshot_export_example1.png" width='200' alt="Export chats"/></a></p>
 - [x] Chat with GPT-4 and 3.5 Turbo 🧠💨
 - [x] **Private**: user-owned API keys 🔑 and localStorage 🛡️
 - [x] **System presets** - including Code, Science, Corporate, and Chat 🎭
@@ -37,7 +37,7 @@ function createDMessage(role: DMessage['role'], text: string): DMessage {
 async function _streamAssistantResponseMessage(
  conversationId: string, history: DMessage[],
  apiKey: string | undefined, apiHost: string | undefined,
-  chatModelId: string, modelTemperature: number, modelMaxTokens: number, abortSignal: AbortSignal,
+  chatModelId: string, modelTemperature: number, modelMaxResponseTokens: number, abortSignal: AbortSignal,
  addMessage: (conversationId: string, message: DMessage) => void,
  editMessage: (conversationId: string, messageId: string, updatedMessage: Partial<DMessage>, touch: boolean) => void,
 ) {
@@ -58,7 +58,7 @@ async function _streamAssistantResponseMessage(
      content: text,
    })),
    temperature: modelTemperature,
-    max_tokens: modelMaxTokens,
+    max_tokens: modelMaxResponseTokens,
  };

  try {
@@ -153,9 +153,9 @@ export function Chat(props: { onShowSettings: () => void, sx?: SxProps }) {
    const controller = new AbortController();
    setAbortController(controller);

-    const { apiKey, modelTemperature, modelMaxTokens, modelApiHost } = useSettingsStore.getState();
+    const { apiKey, modelTemperature, modelMaxResponseTokens, modelApiHost } = useSettingsStore.getState();
    const { appendMessage, editMessage } = useChatStore.getState();
-    await _streamAssistantResponseMessage(conversationId, history, apiKey, modelApiHost, chatModelId, modelTemperature, modelMaxTokens, controller.signal, appendMessage, editMessage);
+    await _streamAssistantResponseMessage(conversationId, history, apiKey, modelApiHost, chatModelId, modelTemperature, modelMaxResponseTokens, controller.signal, appendMessage, editMessage);

    // clear to send, again
    setAbortController(null);
@@ -10,10 +10,11 @@ import PostAddIcon from '@mui/icons-material/PostAdd';
 import StopOutlinedIcon from '@mui/icons-material/StopOutlined';
 import TelegramIcon from '@mui/icons-material/Telegram';

+import { ChatModels } from '@/lib/data';
 import { countModelTokens } from '@/lib/token-counters';
 import { extractPdfText } from '@/lib/pdf';
 import { useActiveConfiguration } from '@/lib/store-chats';
-import { useComposerStore } from '@/lib/store-settings';
+import { useComposerStore, useSettingsStore } from '@/lib/store-settings';
 import { useSpeechRecognition } from '@/components/util/useSpeechRecognition';


@@ -54,6 +55,7 @@ export function Composer(props: { disableSend: boolean; isDeveloperMode: boolean
  // external state
  const { history, appendMessageToHistory } = useComposerStore(state => ({ history: state.history, appendMessageToHistory: state.appendMessageToHistory }), shallow);
  const { chatModelId } = useActiveConfiguration();
+  const modelMaxResponseTokens = useSettingsStore(state => state.modelMaxResponseTokens);


  const handleSendClicked = () => {
@@ -187,7 +189,13 @@ export function Composer(props: { disableSend: boolean; isDeveloperMode: boolean
  const hideOnDesktop = { display: { xs: 'flex', md: 'none' } };

  // compute tokens (warning: slow - shall have a toggle)
-  const estimatedTokens = countModelTokens(composeText, chatModelId);
+  const modelComposerTokens = countModelTokens(composeText, chatModelId);
+  const modelRestOfChatTokens = 0;
+  const estimatedTokens = modelComposerTokens + modelRestOfChatTokens;
+  const modelContextTokens = ChatModels[chatModelId]?.contextWindowSize || 8192;
+  const remainingTokens = modelContextTokens - estimatedTokens - modelMaxResponseTokens;
+  const tokensString = `model: ${modelContextTokens.toLocaleString()} - chat: ${estimatedTokens.toLocaleString()} - response: ${modelMaxResponseTokens.toLocaleString()} = remaining: ${remainingTokens.toLocaleString()} ${remainingTokens < 0 ? '⚠️' : ''}`;
+  const tokenColor = remainingTokens < 1 ? 'danger' : remainingTokens < modelComposerTokens / 4 ? 'warning' : 'primary';

  return (
    <Grid container spacing={{ xs: 1, md: 2 }}>
@@ -252,8 +260,8 @@ export function Composer(props: { disableSend: boolean; isDeveloperMode: boolean

          <Badge
            size='md' variant='solid' max={65535} showZero={false}
-            color={estimatedTokens >= (8192 - 2048) ? 'danger' : estimatedTokens >= (4097 - 2048) ? 'warning' : 'primary'}
-            badgeContent={estimatedTokens}
+            badgeContent={estimatedTokens > 0 ? <Tooltip title={tokensString} color={tokenColor}><span>{estimatedTokens}</span></Tooltip> : 0}
+            color={tokenColor}
            sx={{
              position: 'absolute', bottom: 8, right: 8,
            }}
@@ -54,11 +54,11 @@ function Section(props: { title?: string; collapsible?: boolean, collapsed?: boo
 */
 export function SettingsModal({ open, onClose }: { open: boolean, onClose: () => void; }) {
  // external state
-  const { renderMarkdown, setRenderMarkdown, apiKey, setApiKey, modelTemperature, setModelTemperature, modelMaxTokens, setModelMaxTokens, modelApiHost, setModelApiHost } = useSettingsStore(state => ({
+  const { renderMarkdown, setRenderMarkdown, apiKey, setApiKey, modelTemperature, setModelTemperature, modelMaxResponseTokens, setModelMaxResponseTokens, modelApiHost, setModelApiHost } = useSettingsStore(state => ({
    renderMarkdown: state.renderMarkdown, setRenderMarkdown: state.setRenderMarkdown,
    apiKey: state.apiKey, setApiKey: state.setApiKey,
    modelTemperature: state.modelTemperature, setModelTemperature: state.setModelTemperature,
-    modelMaxTokens: state.modelMaxTokens, setModelMaxTokens: state.setModelMaxTokens,
+    modelMaxResponseTokens: state.modelMaxResponseTokens, setModelMaxResponseTokens: state.setModelMaxResponseTokens,
    modelApiHost: state.modelApiHost, setModelApiHost: state.setModelApiHost,
  }), shallow);

@@ -70,7 +70,7 @@ export function SettingsModal({ open, onClose }: { open: boolean, onClose: () =>

  const handleTemperatureChange = (event: Event, newValue: number | number[]) => setModelTemperature(newValue as number);

-  const handleMaxTokensChange = (event: Event, newValue: number | number[]) => setModelMaxTokens(newValue as number);
+  const handleMaxTokensChange = (event: Event, newValue: number | number[]) => setModelMaxResponseTokens(newValue as number);

  const handleModelApiHostChange = (e: React.ChangeEvent) => setModelApiHost((e.target as HTMLInputElement).value);

@@ -153,7 +153,7 @@ export function SettingsModal({ open, onClose }: { open: boolean, onClose: () =>
              <Slider
                aria-label='Model Temperature' color='neutral'
                min={512} max={8192} step={512} defaultValue={2048}
-                value={modelMaxTokens} onChange={handleMaxTokensChange}
+                value={modelMaxResponseTokens} onChange={handleMaxTokensChange}
                valueLabelDisplay='auto'
                sx={{ py: 1, mt: 1.1 }}
              />
@@ -57,6 +57,7 @@ type ChatModelData = {
  description: string | JSX.Element;
  title: string;
  fullName: string; // seems unused
+  contextWindowSize: number,
 }

 export const ChatModels: { [key in ChatModelId]: ChatModelData } = {
@@ -64,10 +65,12 @@ export const ChatModels: { [key in ChatModelId]: ChatModelData } = {
    description: 'Most insightful, larger problems, but slow, expensive, and may be unavailable',
    title: 'GPT-4',
    fullName: 'GPT-4',
+    contextWindowSize: 8192,
  },
  'gpt-3.5-turbo': {
    description: 'A good balance between speed and insight',
    title: '3.5-Turbo',
    fullName: 'GPT-3.5 Turbo',
+    contextWindowSize: 4096,
  },
 };
@@ -31,8 +31,8 @@ interface SettingsStore {
  modelTemperature: number;
  setModelTemperature: (modelTemperature: number) => void;

-  modelMaxTokens: number;
-  setModelMaxTokens: (modelMaxTokens: number) => void;
+  modelMaxResponseTokens: number;
+  setModelMaxResponseTokens: (modelMaxResponseTokens: number) => void;

 }

@@ -65,8 +65,8 @@ export const useSettingsStore = create<SettingsStore>()(
      modelTemperature: 0.5,
      setModelTemperature: (modelTemperature: number) => set({ modelTemperature }),

-      modelMaxTokens: 2048,
-      setModelMaxTokens: (modelMaxTokens: number) => set({ modelMaxTokens }),
+      modelMaxResponseTokens: 2048,
+      setModelMaxResponseTokens: (modelMaxResponseTokens: number) => set({ modelMaxResponseTokens: modelMaxResponseTokens }),

    }),
    {