<?xml version="1.0" encoding="UTF-8"?>        <rss version="2.0"
             xmlns:atom="http://www.w3.org/2005/Atom"
             xmlns:dc="http://purl.org/dc/elements/1.1/"
             xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
             xmlns:admin="http://webns.net/mvcb/"
             xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
             xmlns:content="http://purl.org/rss/1.0/modules/content/">
        <channel>
            <title>
									ud3ecub3c4 (PhoDo) ud3ecub7fc - 최근 주제들				            </title>
            <link>https://phodo.wanitdoit.com/community/</link>
            <description>ud3ecub3c4 (PhoDo) ud1a0ub860 uac8cuc2dcud310</description>
            <language>ko-KR</language>
            <lastBuildDate>Thu, 21 May 2026 05:50:45 +0000</lastBuildDate>
            <generator>wpForo</generator>
            <ttl>60</ttl>
							                    <item>
                        <title>Gemini 2.5 Flash로 사진을 평가한다는 것</title>
                        <link>https://phodo.wanitdoit.com/community/%eb%a9%94%ec%9d%b8-%ed%8f%ac%eb%9f%bc/%ec%9d%b4%ea%b2%83%ec%9d%80-%ec%b2%ab-%eb%b2%88%ec%a7%b8-%ed%8f%ac%eb%9f%bc%ec%9d%b4%eb%8b%a4/</link>
                        <pubDate>Tue, 20 Jan 2026 15:35:50 +0000</pubDate>
                        <description><![CDATA[들어가며
최근 포도(PhoDo)라는 사진 평가 서비스를 사용해봤는데, AI가 내 사진에 점수를 매기고 자연어 피드백까지 준다는 개념이 꽤 흥미로웠습니다.
내부적으로 Google Gemini 2.5 Flash 모델을 사용하고, 이 모델이 &quot;사진 평가&quot;라는 태스크에 얼마나 적합한지, 그리고 서비스 설계 방식이 어떤 의미를 갖는지 같이 이야...]]></description>
                        <content:encoded><![CDATA[<h2 id="%EB%93%A4%EC%96%B4%EA%B0%80%EB%A9%B0" class="code-line" dir="auto" data-line="8">들어가며</h2>
<p class="code-line" dir="auto" data-line="10">최근 포도(PhoDo)라는 사진 평가 서비스를 사용해봤는데, AI가 내 사진에 점수를 매기고 자연어 피드백까지 준다는 개념이 꽤 흥미로웠습니다.</p>
<p class="code-line" dir="auto" data-line="10">내부적으로<span> </span><strong>Google Gemini 2.5 Flash</strong><span> </span>모델을 사용하고, 이 모델이 "사진 평가"라는 태스크에 얼마나 적합한지, 그리고 서비스 설계 방식이 어떤 의미를 갖는지 같이 이야기해보고 싶어서 글을 올립니다.</p>
<p class="code-line" dir="auto" data-line="12">서비스 설계 문서를 기반으로 기술적인 관점에서 몇 가지 포인트를 정리해봤습니다. 의견이나 반론, 추가 분석 모두 환영합니다!</p>
<p dir="auto" data-line="12"> </p>
<h2 id="1-%EC%99%9C-gemini-25-flash%EC%9D%B8%EA%B0%80" class="code-line" dir="auto" data-line="16">1. 왜 Gemini 2.5 Flash인가?</h2>
<p>&nbsp;</p>
<p class="code-line" dir="auto" data-line="18">포도는<span> </span><code>gemini-2.5-flash</code><span> </span>모델을 선택했습니다. GPT-4o나 Claude 같은 다른 멀티모달 모델과 비교했을 때 이 선택이 갖는 의미를 생각해보면:</p>
<table class="code-line" dir="auto" data-line="20">
<thead class="code-line" dir="auto" data-line="20">
<tr class="code-line" dir="auto" data-line="20">
<th>비교 항목</th>
<th>Gemini 2.5 Flash</th>
<th>GPT-4o (참고)</th>
</tr>
</thead>
<tbody class="code-line" dir="auto" data-line="22">
<tr class="code-line" dir="auto" data-line="22">
<td>응답 속도</td>
<td>&#x26a1; 빠름 (Flash 계열)</td>
<td>보통</td>
</tr>
<tr class="code-line" dir="auto" data-line="23">
<td>멀티모달</td>
<td>&#x2705; 네이티브 지원</td>
<td>&#x2705; 지원</td>
</tr>
<tr class="code-line" dir="auto" data-line="24">
<td>JSON 출력</td>
<td>&#x2705; 구조화 응답 안정적</td>
<td>&#x2705; 지원</td>
</tr>
<tr class="code-line" dir="auto" data-line="25">
<td>비용</td>
<td>상대적으로 저렴</td>
<td>상대적으로 고가</td>
</tr>
<tr class="code-line" dir="auto" data-line="26">
<td>Google 생태계</td>
<td>&#x2705; 통합 용이</td>
<td>&#x274c;</td>
</tr>
</tbody>
</table>
<p class="code-line" dir="auto" data-line="28">"Flash" 계열은 속도와 비용 효율에 최적화된 모델입니다. 사진 평가라는 태스크 특성상 —<span> </span><strong>사용자가 업로드 직후 빠른 피드백을 원한다</strong><span> </span>— Flash 모델의 선택은 UX 측면에서 합리적인 결정으로 보입니다.</p>
<blockquote class="code-line" dir="auto" data-line="30">
<p class="code-line" dir="auto" data-line="30"><strong>토론 포인트 1:</strong><span> </span>Gemini 2.0 Flash 대비 2.5 Flash가 멀티모달 이해력에서 실질적으로 더 나은 결과를 보여줄까요? 사진의 미적 판단에서 차이가 체감되는 경험이 있으신가요?</p>
</blockquote>
<p dir="auto" data-line="28"> </p>
<h2 id="2-temperature-02--%EA%B3%B5%EC%A0%95%ED%95%9C-%EC%8B%AC%EC%82%AC%EC%9C%84%EC%9B%90%EC%9D%84-%EB%A7%8C%EB%93%A4%EB%A0%A4%EB%8A%94-%EC%8B%9C%EB%8F%84" class="code-line" dir="auto" data-line="34">2. Temperature 0.2 — "공정한 심사위원"을 만들려는 시도</h2>
<p class="code-line" dir="auto" data-line="36">서비스에서 눈에 띄는 설계 결정 중 하나는<span> </span><code>temperature: 0.2</code>입니다. 이는 LLM이 얼마나 "창의적(무작위적)"으로 응답할지를 조절하는 값으로, 0에 가까울수록 결정론적이고 일관된 출력이 나옵니다.</p>
<p class="code-line" dir="auto" data-line="38"><strong>왜 이 값이 중요한가:</strong></p>
<p class="code-line" dir="auto" data-line="40">같은 사진을 두 번 평가했을 때 점수가 크게 달라진다면, 서비스의 신뢰도가 떨어집니다.<span> </span><code>0.2</code>는<span> </span><strong>재현 가능한 평가</strong>를 위한 선택입니다.</p>
<div>
<div><span>Temperature 0.0 → 완전히 결정론적 (같은 입력 = 거의 같은 출력)</span></div>
<div><span>Temperature 0.2 → 약간의 변동 허용 (자연스러운 문장 생성)</span></div>
<div><span>Temperature 1.0 → 창의적이지만 불안정</span></div>
</div>
<p class="code-line" dir="auto" data-line="48">반면 트레이드오프도 있습니다. Temperature가 낮으면 AI 코멘트가 틀에 박힌 문장 패턴으로 반복될 가능성이 높고, 사용자가 "이 피드백이 모든 사람한테 비슷하게 나오는 거 아냐?"라는 인상을 받을 수 있습니다.</p>
<blockquote class="code-line" dir="auto" data-line="50">
<p class="code-line" dir="auto" data-line="50"><strong>토론 포인트 2:</strong><span> </span>사진 평가 서비스에서 일관성(낮은 temperature)과 다양한 피드백(높은 temperature) 중 무엇이 더 중요할까요? 혹은 두 요소를 절충할 수 있는 다른 방법이 있을까요?</p>
</blockquote>
<hr class="code-line" dir="auto" data-line="52" />
<h2 id="3-%EC%A0%90%EC%88%98-%EC%82%B0%EC%B6%9C-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98--%EA%B0%80%EC%A4%91-%ED%8F%89%EA%B7%A0%EC%9D%98-%ED%95%A8%EC%9D%98" class="code-line" dir="auto" data-line="54">3. 점수 산출 알고리즘 — 가중 평균의 함의</h2>
<p class="code-line" dir="auto" data-line="56">포도의 최종 점수는 다음 공식으로 계산됩니다:</p>
<p class="katex-block"><span class="katex-display"><span class="katex"><span class="katex-mathml">final_score=∑(scorei×weighti)∑weighti×20</span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut"></span><span class="mord text"><span class="mord">final_score</span></span><span class="mspace"></span><span class="mrel">=</span><span class="mspace"></span></span><span class="base"><span class="strut"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist"><span><span class="pstrut"></span><span class="mop op-symbol small-op">∑</span><span class="mspace"></span><span class="mord text">weight</span><span class="msupsub"><span class="pstrut"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathnormal mtight">i</span></span><span class="vlist-s">​</span></span></span><span><span class="pstrut"></span><span class="frac-line"></span></span><span><span class="pstrut"></span><span class="mop op-symbol small-op">∑</span><span class="mopen">(</span><span class="mord text">score</span><span class="msupsub"><span class="pstrut"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathnormal mtight">i</span></span><span class="vlist-s">​</span></span><span class="mspace"></span><span class="mbin">×</span><span class="mspace"></span><span class="mord text">weight</span><span class="msupsub"><span class="pstrut"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathnormal mtight">i</span></span><span class="vlist-s">​</span></span><span class="mclose">)</span></span></span><span class="vlist-s">​</span></span><span class="vlist-r"><span class="vlist"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span><span class="mspace"></span><span class="mbin">×</span><span class="mspace"></span></span><span class="base"><span class="strut"></span><span class="mord">20</span></span></span></span></span></p>
<p class="code-line" dir="auto" data-line="60">각 항목은 0–5점이고, 100점 만점으로 환산됩니다. 운영자가 항목별 가중치를 직접 설정할 수 있어서, 예를 들어 "인물 사진 테스트"에서는<span> </span><strong>피사체 선명도</strong>에 가중치를 높게,<span> </span><strong>배경 처리</strong>에는 낮게 줄 수 있겠죠.</p>
<p class="code-line" dir="auto" data-line="62"><strong>이 구조의 장점:</strong></p>
<ul class="code-line" dir="auto" data-line="63">
<li class="code-line" dir="auto" data-line="63">테스트 목적에 따라 평가 기준을 유연하게 설계 가능</li>
<li class="code-line" dir="auto" data-line="64">운영자가 코드 변경 없이 Notion에서 조정 가능</li>
</ul>
<p class="code-line" dir="auto" data-line="66"><strong>잠재적 문제점:</strong></p>
<ul class="code-line" dir="auto" data-line="67">
<li class="code-line" dir="auto" data-line="67">AI(Gemini)가 각 항목에 영수증처럼 정확한 0–5점을 매기는 것이 가능한가? → AI는 사실<span> </span><strong>연속적인 판단</strong>을 하는데, 이를 정수 점수로 강제하는 것이 정보 손실을 일으킬 수 있음</li>
<li class="code-line" dir="auto" data-line="68">가중치 설계 자체가 운영자의 주관에 의존 → "올바른 가중치"는 누가 결정하는가?</li>
</ul>
<blockquote class="code-line" dir="auto" data-line="70">
<p class="code-line" dir="auto" data-line="70"><strong>토론 포인트 3:</strong>AI가 생성하는 점수(0–5 정수)를 그대로 믿을 수 있을까요? 같은 사진을 항목 설명만 바꿔서 평가하면 점수가 달라질까요? 프롬프트 민감도 실험을 해 본 분 계신가요?</p>
</blockquote>
<h2 id="4-%EB%A9%80%ED%8B%B0%EB%AA%A8%EB%8B%AC-ai%EC%9D%98-%EB%AF%B8%EC%A0%81-%ED%8C%90%EB%8B%A8--%EC%96%B4%EB%94%94%EA%B9%8C%EC%A7%80-%EB%AF%BF%EC%9D%84-%EC%88%98-%EC%9E%88%EC%9D%84%EA%B9%8C" class="code-line" dir="auto" data-line="74">4. 멀티모달 AI의 미적 판단 — 어디까지 믿을 수 있을까?</h2>
<p class="code-line" dir="auto" data-line="76">포도의 가장 본질적인 질문은 여기에 있습니다.</p>
<blockquote class="code-line" dir="auto" data-line="78">
<p class="code-line" dir="auto" data-line="78"><strong>"AI가 사진의 미적 가치를 제대로 평가할 수 있는가?"</strong></p>
</blockquote>
<p class="code-line" dir="auto" data-line="80">Gemini는 텍스트+이미지를 동시에 이해하지만, 그 판단은 결국<span> </span><strong>학습 데이터에 편향</strong>됩니다. 인터넷에 많이 존재하는 "좋은 사진"의 패턴(구도, 밝기, 색감)을 학습한 것이기 때문에:</p>
<ul class="code-line" dir="auto" data-line="82">
<li class="code-line" dir="auto" data-line="82">&#x1f4f8;<span> </span><strong>상업 사진, 인스타그램 스타일</strong><span> </span>→ 높은 점수를 받기 유리할 수 있음</li>
<li class="code-line" dir="auto" data-line="83">&#x1f3a8;<span> </span><strong>실험적·예술적 사진</strong><span> </span>→ 모델이 "잡음"으로 판단해 낮은 점수를 줄 가능성</li>
<li class="code-line" dir="auto" data-line="84">&#x1f4f7;<span> </span><strong>문화권별 미적 기준 차이</strong><span> </span>→ 서양 중심의 학습 데이터가 영향을 미칠 수 있음</li>
</ul>
<p class="code-line" dir="auto" data-line="86">물론 이를 완화하는 것이 바로<span> </span><strong>운영자 프롬프트 설계</strong>입니다. "예술적 실험성을 긍정적으로 평가하라"는 프롬프트를 통해 어느 정도 방향을 잡을 수 있겠지만, 한계는 분명히 존재합니다.</p>
<blockquote class="code-line" dir="auto" data-line="88">
<p class="code-line" dir="auto" data-line="88"><strong>토론 포인트 4:</strong>여러분이 직접 서비스를 사용해봤다면, AI의 평가가 본인의 기대와 얼마나 일치했나요? 어떤 종류의 사진이 "과대평가" 혹은 "과소평가"된다고 느끼셨나요?</p>
</blockquote>
<p dir="auto" data-line="88"> </p>
<h2 id="%EB%A7%88%EC%B9%98%EB%A9%B0--%EC%9D%B4-%EC%84%9C%EB%B9%84%EC%8A%A4%EA%B0%80-%EB%8D%98%EC%A7%80%EB%8A%94-%EB%8D%94-%ED%81%B0-%EC%A7%88%EB%AC%B8" class="code-line" dir="auto" data-line="143">마치며 — 이 서비스가 던지는 더 큰 질문</h2>
<p class="code-line" dir="auto" data-line="145">포도(PhoDo)는 단순한 재미 앱처럼 보이지만, 그 안에는 꽤 흥미로운 기술적·철학적 질문들이 담겨 있습니다.</p>
<ol class="code-line" dir="auto" data-line="147">
<li class="code-line" dir="auto" data-line="147"><strong>AI의 심미적 판단을 얼마나 신뢰할 것인가?</strong></li>
<li class="code-line" dir="auto" data-line="148"><strong>"객관적 점수"처럼 보이는 AI 평가가 실은 운영자의 주관을 반영한다면?</strong></li>
<li class="code-line" dir="auto" data-line="149"><strong>사진 교육 도구로서 AI 피드백의 한계는 어디까지인가?</strong></li>
</ol>
<hr class="code-line" dir="auto" data-line="153" />
<p class="code-line" dir="auto" data-line="155"><strong>&#x1f4ac; 댓글로 의견 남겨주세요!</strong></p>
<ul class="code-line" dir="auto" data-line="157">
<li class="code-line" dir="auto" data-line="157">포도 서비스를 직접 사용해본 경험이 있으신가요?</li>
<li class="code-line" dir="auto" data-line="158">AI 사진 평가의 가장 큰 맹점이 무엇이라고 보시나요?</li>
<li class="code-line" dir="auto" data-line="159">다른 멀티모달 모델(GPT-4o, Claude 3.5)로 유사한 시도를 해보셨나요?</li>
</ul>]]></content:encoded>
						                            <category domain="https://phodo.wanitdoit.com/community/"></category>                        <dc:creator>admin</dc:creator>
                        <guid isPermaLink="true">https://phodo.wanitdoit.com/community/%eb%a9%94%ec%9d%b8-%ed%8f%ac%eb%9f%bc/%ec%9d%b4%ea%b2%83%ec%9d%80-%ec%b2%ab-%eb%b2%88%ec%a7%b8-%ed%8f%ac%eb%9f%bc%ec%9d%b4%eb%8b%a4/</guid>
                    </item>
							        </channel>
        </rss>
		