<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Posts on xxx的个人空间</title><link>https://my-blog-source-e1i.pages.dev/posts/</link><description>Recent content in Posts on xxx的个人空间</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 20 May 2026 16:41:02 +0800</lastBuildDate><atom:link href="https://my-blog-source-e1i.pages.dev/posts/index.xml" rel="self" type="application/rss+xml"/><item><title>Hello World</title><link>https://my-blog-source-e1i.pages.dev/posts/hello-world/</link><pubDate>Wed, 20 May 2026 16:41:02 +0800</pubDate><guid>https://my-blog-source-e1i.pages.dev/posts/hello-world/</guid><description>&lt;p&gt;这是lhk的个人博客，终于搭建起来了&lt;/p&gt;</description></item><item><title/><link>https://my-blog-source-e1i.pages.dev/posts/%E9%AB%98%E7%A9%BA%E6%8A%9B%E7%89%A9%E8%AF%86%E5%88%ABresnet/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://my-blog-source-e1i.pages.dev/posts/%E9%AB%98%E7%A9%BA%E6%8A%9B%E7%89%A9%E8%AF%86%E5%88%ABresnet/</guid><description>&lt;h1 id="基于tsm的高空抛物识别系统"&gt;基于TSM的高空抛物识别系统&lt;/h1&gt;
&lt;h2 id="模型选择"&gt;模型选择&lt;/h2&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;&lt;strong&gt;特性&lt;/strong&gt;&lt;/th&gt;
&lt;th&gt;&lt;strong&gt;YOLO (目标检测)&lt;/strong&gt;&lt;/th&gt;
&lt;th&gt;&lt;strong&gt;TSM (动作识别)&lt;/strong&gt;&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;输入单元&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;单张图片 (.jpg)&lt;/td&gt;
&lt;td&gt;视频片段 (.mp4 / 帧序列)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;标签文件&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;坐标框 (txt/xml)&lt;/td&gt;
&lt;td&gt;类别 ID (0 或 1)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;难点&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;小目标检测、重叠遮挡&lt;/td&gt;
&lt;td&gt;采样频率、动作起始点定位&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;本项目应用&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;识别“这是个瓶子”&lt;/td&gt;
&lt;td&gt;识别“瓶子正在坠落”&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;OpenMMLab (MMAction2)&lt;/strong&gt; 框架，搭配 &lt;strong&gt;TSM 模型&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="tsmtemporal-shift-module简介"&gt;TSM（Temporal Shift Module）简介&lt;/h2&gt;
&lt;h3 id="一句话定义"&gt;一句话定义&lt;/h3&gt;
&lt;p&gt;TSM 是一种&lt;strong&gt;轻量级视频理解模型&lt;/strong&gt;，通过在时间维度上&amp;quot;移动&amp;quot;特征来捕捉动作信息，几乎不增加计算量。&lt;/p&gt;
&lt;hr&gt;
&lt;h3 id="核心原理"&gt;核心原理&lt;/h3&gt;
&lt;p&gt;普通 CNN 处理图片时，每一帧是独立的——它不知道前一帧和后一帧发生了什么。&lt;/p&gt;
&lt;p&gt;TSM 的做法很简单：&lt;strong&gt;把特征图在时间维度上移一下&lt;/strong&gt;。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;时间步: t-1 t t+1
通道1: ←───── ─────
通道2: ───── ─────→
通道3: 不动 不动 不动
&lt;/code&gt;&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;一部分通道&lt;strong&gt;向前&lt;/strong&gt;看一帧&lt;/li&gt;
&lt;li&gt;一部分通道&lt;strong&gt;向后&lt;/strong&gt;看一帧&lt;/li&gt;
&lt;li&gt;一部分通道&lt;strong&gt;不动&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这样模型在处理第 t 帧时，天然就能&amp;quot;感知&amp;quot;到 t-1 和 t+1 帧的信息，从而理解&lt;strong&gt;运动方向和速度&lt;/strong&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h3 id="为什么适合高空抛物"&gt;为什么适合高空抛物&lt;/h3&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;特性&lt;/th&gt;
&lt;th&gt;单帧检测（YOLO）&lt;/th&gt;
&lt;th&gt;TSM（视频理解）&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;输入&lt;/td&gt;
&lt;td&gt;1 张图片&lt;/td&gt;
&lt;td&gt;8 帧连续画面&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;能识别&lt;/td&gt;
&lt;td&gt;&amp;ldquo;有个瓶子&amp;rdquo;&lt;/td&gt;
&lt;td&gt;&amp;ldquo;瓶子在往下掉&amp;rdquo;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;计算量&lt;/td&gt;
&lt;td&gt;低&lt;/td&gt;
&lt;td&gt;和单帧几乎一样&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;高空抛物的关键不是&amp;quot;有什么东西&amp;quot;，而是&amp;quot;这个东西在&lt;strong&gt;运动&lt;/strong&gt;&amp;quot;。TSM 能捕捉这种&lt;strong&gt;时序变化&lt;/strong&gt;，而且计算量几乎没有增加。&lt;/p&gt;</description></item></channel></rss>